AI热点 4小时前 89 阅读 0 评论

全球首款AI原生游戏引擎再进化:GTA6再不来,我们就AI一个

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

机器之心报道

编辑:Panda、冷猫

说是 GTA 6 又跳票到明年了。

作为开放世界游戏的标杆,GTA 系列不仅在游戏圈声名赫赫。尤其是在 AI 驱动的视频生成、三维生成或是世界模型等领域里,研究者们不仅采用游戏内场景为训练数据,更将生成类 GTA 的完整世界作为长久以来的目标。

但 GTA 6 的难产已经成为一个过不去的梗,大家总是在调侃:用 AI 做个 GTA 比 GTA 6 发布还快,就比如我们之前报道过的 Decart AI。

但真的要用 AI 做一个 GTA 出来,一个游戏引擎是必不可少的。一个多月前,我们报道过全球首个由实时世界模型驱动的 AI 原生 UGC 游戏引擎 Mirage。

在当时,我们拿公司附近的照片测试了一下场景生成的效果,很难说尽如人意。

<video class="" playsinline="true" x5-playsinline="true" webkit-playsinline="true" tabindex="2" mediatype="video" src="https://v26-web.toutiaovod.com/20a593e2cf4d4e9b8c0a6b5e6efb9e48/68a83bbd/video/tos/cn/tos-cn-ve-e5b010/oMNsLVD1QFJgIjBqEgENMU5UAtCqfh1QoofVgy/?a=24&ch=0&cr=0&dr=0&er=0&cd=0|0|0|0&br=1733&bt=1733&cs=0&ds=4&ft=hGkwBy6LRR0siqC5NDv2Nc0iPMgzbLZ.KxdU_4gmPRiJNv7TGW&mime_type=video_mp4&qs=0&rc=NWVpZTc3NGVkaTYzaDgzZEBpM3NlZ3A5cmc1NTUzNDs6M0AzLmEvXzUxX2IxYjItYmBhYSMuYDBnMmRjZGhhLS1kNmFzcw==&btag=80000e00020000&dy_q=1755852158&feature_id=59cb2766d89ae6284516c6a254e9fb61&l=20250822164238CEEAAFDDA614505FE208"></video>
不支持的音频/视频格式 请试试刷新
<button type="button" class="xg-icon-play"></button> <svg xmlns="http://www.w3.org/2000/svg" class="xgplayer-replay-svg" viewBox="0 0 78 78" width="78" height="78"> </svg>重播
<button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
播放
00:00 / 00:00 直播
00:00
<button type="button" class="xg-get-fullscreen"></button><button type="button" class="xg-exit-fullscreen"></button>
进入全屏
<button type="button" class="xg-volume-small"></button><button type="button" class="xg-volume"></button><button type="button" class="xg-volume-mute"></button>
50
    点击按住可拖动视频
    <svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 20 20"> </svg>
    <button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>

    但谁能想到,仅仅过了一个多月,Mirage 就再一次迭代进化,发布了更强大、更灵活、更智能的 Mirage 2

    Dynamic Labs 称它为生成式世界引擎 —— 不仅仅是为游戏而生,而是为任何你能想象的互动世界。

    「从 Mirage 1 到 Mirage 2,仅仅一个月,我们没有停下脚步,而是加速前进。」

    他们号称,如果 Mirage 1 展示了一个类似 GTA 世界模型的潜力,那么 Mirage 2 是一款通用领域的世界模型,能让你即时创造、体验和改变任何游戏世界

    和 Mirage 1 一样,Mirage 2 同样支持上传图片,将其转换成可交互的游戏世界。Mirage 2 也支持实时对话,在游戏过程中随时通过文本指令修改游戏世界。在这一次,Mirage 支持生成的游戏场景通过视频进行分享。

    Mirage 2 在生成性能上有了明显的进步。通过架构革新,它实现了:

    • 更灵敏的提示控制:你的想法更快落地,画面更精准。
    • 更低的游戏延迟:操作更顺畅,等待更少,沉浸感更强。
    • 通用领域建模:不限题材,任何风格的世界都能实现。

    在上一次,Mirage 仅发布了两款可玩的 demo,一个是 GTA 城市风格,另一个是竞速风格。

    这一次打开 demo 页面,与 Mirage 1 的交互基本一致,他们把 UI 做的精致了不少。重点是,Mirage 2 显著突出了各种完全不同风格的场景可选。

    咱们举几个和传统的城市风格完全不一样的,比较跳脱的例子:

    吉卜力风格:村庄任务

    儿童画:彩色城市

    繁星之夜

    除此以外,Mirage 2 能够实现在交互过程中通过文本指令来修改世界:

    <video class="" playsinline="true" x5-playsinline="true" webkit-playsinline="true" tabindex="2" mediatype="video" src="https://v6-web.toutiaovod.com/528e90d1de75e2874531ae9ad11b933d/68a83bb1/video/tos/cn/tos-cn-ve-e5b010/oMDeNEwQhEKqCFw5FC3fyiDdWrJLBhgOooICJA/?a=24&ch=0&cr=0&dr=0&er=0&cd=0|0|0|0&br=2147&bt=2147&cs=0&ds=4&ft=WbaUMqBrffPdO.~SN1jNvAq-antLjrKo~EfCRkaJNdDGejVhWL6&mime_type=video_mp4&qs=0&rc=aTg4OjVnNWQ8ZDk7M2hnNUBpajhkcXI5cmo1NTUzNDs6M0AwX180M15hX18xYjZeYi9jYSMyamgwMmRrZGhhLS1kNi9zcw==&btag=c0000e00018000&dy_q=1755852158&feature_id=59cb2766d89ae6284516c6a254e9fb61&l=20250822164238052672F3A6D73FDE7305"></video>
    不支持的音频/视频格式 请试试刷新
    <button type="button" class="xg-icon-play"></button> <svg xmlns="http://www.w3.org/2000/svg" class="xgplayer-replay-svg" viewBox="0 0 78 78" width="78" height="78"> </svg>重播
    <button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
    播放
    00:00 / 00:00 直播
    00:00
    <button type="button" class="xg-get-fullscreen"></button><button type="button" class="xg-exit-fullscreen"></button>
    进入全屏
    <button type="button" class="xg-volume-small"></button><button type="button" class="xg-volume"></button><button type="button" class="xg-volume-mute"></button>
    50
      点击按住可拖动视频
      <svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 20 20"> </svg>
      <button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>

      有了对广泛不同风格的场景支持,Mirage 2 似乎已经有了与 DeepMind 最新的 Genie 3 世界模型叫板的底气。相比于 Genie 3,Mirage 2 能够实现跑、跳、攻击等动作,十分钟以上的交互时间,200ms 的延迟水平,并能在单个消费级 GPU 上运行。但 Mirage 2 最大的不同是:它已经上线可以立即体验

      • 感兴趣的读者可以体验一下:https://demo.dynamicslab.ai/chaos

      机器之心自然也上手测试了一下,和测试 Mirage 1 的时候一样,我们还用了同一张公司附近的照片上传测试,导出视频如下:

      <video class="" playsinline="true" x5-playsinline="true" webkit-playsinline="true" tabindex="2" mediatype="video" src="https://v3-web.toutiaovod.com/dd1f01b326a2dc031fb9c1bdc361e22c/68a83bc2/video/tos/cn/tos-cn-ve-e5b010/o0lI4Ue9Q8szajUC8Q9GeBUDCVTLg6FATfERIT/?a=24&ch=0&cr=0&dr=0&er=0&cd=0|0|0|0&br=1545&bt=1545&cs=0&ds=4&ft=hGkwBy6LRR0s~dC52Dv2Nc.xBiGNbLZ.KxdU_4S1XwTJNv7TGW&mime_type=video_mp4&qs=0&rc=Zjs6ODo1NWdpZWYzM2RmOkBpM3hya3U5cmw1NTUzNDs6M0BhMDMzYDQtNl4xXmI1MWIvYSMycjQ0MmRrZGhhLS1kNmFzcw==&btag=c0000e00020000&dy_q=1755852158&feature_id=59cb2766d89ae6284516c6a254e9fb61&l=202508221642374FD7E8982C66CC0C6821"></video>
      不支持的音频/视频格式 请试试刷新
      <button type="button" class="xg-icon-play"></button> <svg xmlns="http://www.w3.org/2000/svg" class="xgplayer-replay-svg" viewBox="0 0 78 78" width="78" height="78"> </svg>重播
      <button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>
      播放
      00:00 / 00:00 直播
      00:00
      <button type="button" class="xg-get-fullscreen"></button><button type="button" class="xg-exit-fullscreen"></button>
      进入全屏
      <button type="button" class="xg-volume-small"></button><button type="button" class="xg-volume"></button><button type="button" class="xg-volume-mute"></button>
      50
        点击按住可拖动视频
        <svg xmlns="http://www.w3.org/2000/svg" width="20" height="20" viewBox="0 0 20 20"> </svg>
        <button type="button" class="xg-icon-play"></button><button type="button" class="xg-icon-pause"></button>

        这次我们给了一些详细的 Prompt,效果和上一次对比简直是飞跃。

        不仅显著改善了 Mirage 1 物体比例的问题,加强了场景理解,场景的精度也有了明显的改善。人和车的模型明显变得更加合理,车流已经明显有了 GTA 4 的既视感。

        虽然在线体验时的延迟非常高,人物灵敏度和上次对比感知不到明显改善,但是导出的视频比较流畅。

        在 Mirage 1 发布时,团队成员 Zhiting Hu 表示推理时间约为 700ms,在 Mirage 2 上显著改善至 200ms,并且 Dynamics Lab 表示仍然有进一步加速的空间。

        尽管 Mirage 2 在生成式世界建模方面取得了重大进展,但仍有一些技术问题:

        • 动作控制精度:角色的操作还不够完美,比如在右转等动作上,偶尔会出现响应偏慢的情况。
        • 视觉一致性:在快速切换场景时,可能会出现细节上的意外变化。不过,通过合理的提示工程(prompt engineering),可以在较长时间内保持画面一致性。

        我们试玩下来感知最明显的就是视觉一致性的问题。在上面的测试视频中有两点可以明显看出世界一致性不足的问题:当操作的主角走过电瓶车的人,视角被遮挡后,我们操作的主角莫名其妙的变成了骑电瓶车的人;视角回转时,照片中的建筑物已经完全不是原先的样子了。

        这种效果与 Genie 3 的演示的一致性效果相差甚远,正如读者在 Mirage 1 的报道下评论的那样:

        不过,虽然仍然存在这些亟待解决的问题,仅仅过了一个多月,Mirage 就已经取得了如此进步,距离 GTA 6 发售还有九个月,到时候这些 AI 驱动的 UGC 游戏引擎又会发展到哪一步呢?

        参考链接:

        https://blog.dynamicslab.ai/

        文中视频链接:https://mp.weixin.qq.com/s/f4hxFkE5HoTL7Eel8pslmQ

        作者头像

        AI前线

        专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

        246篇文章 1.2M阅读 56.3k粉丝

        评论 (128)

        用户头像

        AI爱好者

        2小时前

        这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

        用户头像

        开发者小明

        昨天

        有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

        作者头像

        AI前线 作者

        12小时前

        我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

        用户头像

        科技观察家

        3天前

        GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!