关于生数科技

我们是全球首个实现数字世界和物理世界统一的通用世界模型公司。我们致力于构建对数字世界及物理世界的规律进行建模、推理、预测、行动的通用智能框架。我们坚持第一性原理，基于天然承载物理世界表征的视觉和听觉信息，训练我们的基座世界模型，还原人类对物理世界认知、模拟与交互的过程，最终实现连通数字与物理世界的通用人工智能(AGI)。

我们的基座世界模型

我们技术栈的核心是我们的基座世界模型。我们以融合了 diffusion-transformer 范式的自研 U-ViT 架构训练基座世界模型，还原人类构建对物理世界认知的过程，以此实现基座世界模型对世界的底层认知。

世界生成模型

我们以世界生成模型 Vidu 为核心驱动力，于数字世界提供先进的多模态生成能力。基于我们基座世界模型对世界强大的理解和重构能力，Vidu 能够解码并呈现音视频内容供用户观看，支持高保真内容创作以及与创作者的协同创作创新，从而实现强大的文生视频、图生视频及参考生视频等能力，亦提升世界生成的一致性、物理合理性、交互性，让模型从“单纯生成数字内容”升级为“理解背后的世界规律”，并构建动态数字世界及藉此提升底层基座世界模型的通用能力。

世界行动模型

我们以世界行动模型 MotuBrain 构建大一统架构，实现具身智能的多任务泛化及高数据效率。MotuBrain 采用 Mixture-of-Transformer（MoT）架构，通过将多项功能整合至统一框架，解决具身智能体在理解、建模及控制层面的碎片化问题。相较于 VLA 路径，世界模型普遍被认为具有更强的通用性，且更适合作为物理世界应用的基座模型。基于基座世界模型对物理规律的理解，以及在序列行动下的状态预测能力，Motus 将预测直接转化为机器人、智能设备等物理载体的可执行动作，同时通过物理世界的行动反馈，反向优化模型对世界的认知，形成“虚拟建模 - 物理行动 - 反馈迭代”的正向闭环。