Runaway 发布的:探索通用世界模型
我们相信,人工智能(AI)的下一次重大飞跃将源自于能够理解视觉世界及其变化的系统。正因如此,我们启动了一项长期的研究项目,专注于开发我们所称的“通用世界模型”。
什么是通用世界模型(GWM)呢?
通用世界模型是一种 AI 系统,它能够构建对一个环境的内在理解,并利用这种理解来预测环境中将发生的事件。目前,世界模型的研究主要局限于非常受限和可控的环境中,比如模拟的游戏世界,或者是特定领域,例如用于驾驶的世界模型。而通用世界模型的目标,是能够呈现和模拟现实世界中遇到的各种复杂情境和互动。
我们可以把像 Gen-2 这样的视频生成系统看作是通用世界模型的初步尝试。为了生成真实感强的短视频,Gen-2 需要对物理和运动有一定的理解。但它的能力仍然有限,尤其是在处理复杂的相机动作或物体运动时会遇到困难。
要构建真正的通用世界模型,我们面临着诸多研究上的挑战。比如,这些模型需要能够生成环境的精确映射,并在这些环境中进行有效的导航和互动。它们不仅要能够捕捉世界的动态变化,还需要理解居住在这个世界中的生物,尤其是构建出符合现实的人类行为模型。
目前,我们正在组建一个团队来应对这些挑战。如果你对加入这项研究工作感兴趣,我们非常期待你的加入。
https://t.co/zFwq5phwWs