· 世界模型· Google· MR
Project Genie:Google 把世界模型推到了消费侧
1 月 30 日 Google 上线了 Project Genie 的消费版本——输入一句话或一张图,生成一个可以实时操作的 3D 世界。当前限制是单次时长 60 秒,且仅对 Gemini Ultra 订阅开放。
意义不在 demo 多惊艳,而在于第一次有一家公司把『世界模型』这个东西塞进了消费产品里。在这之前,Genie / Cosmos / Mirage 都只在论文、API、研究演示里活着。现在它有付费墙、有用户量、有 60 秒的硬性产品边界——这是研究项目变产品的标志。
第二天(1 月 31 日)社区的反应里最有意思的一条是:有人开始讨论怎么把 Genie 接到 VR 里玩。最朴素的方案就是把电脑画面投到头显里当超大曲面屏;更激进的方向,是等 Google 直接放出一套面向头显的 SDK。这条路径恰好对应我在 世界模型在 MR 里的位置 里写的『B 路径:让世界模型直接当 MR 体验的运行时』。
如果把 Genie 真接进 VR
把电脑画面投到头显这种 cast 方案很取巧,但它本质上是『在 VR 里看一块屏』,不是 VR 体验。真正有意思的问题是:当世界模型变成头显的运行时,整个交互范式要重写哪几条。
我能想到三件事:
- 输入维度从『打字』变成『身体』。 Genie 现在收一句 prompt 给一个世界,但 VR 用户的输入是手柄、头部姿态、眼动、可能还有 EMG。模型要能把『我向左看』『我伸手抓』当成 prompt 的一部分实时改写世界,而不是预先生成一段。
- 延迟预算从 100ms 掉到 11ms。 屏幕游戏 60fps 已经够,VR 是 90Hz 起步、运动到光子(M2P)要压在 20ms 以内。Genie 当前的生成节奏是为视频准备的,挪到头显上整条 pipeline 都得重做(Decart Mirage 押的就是这条线)。
- 60 秒边界会被晕动症放大。 屏幕上看一段 60 秒漂移的世界顶多出戏,戴在脸上一旦几何不稳定就直接吐。这意味着 VR 版的 Genie 必须先解决长时连贯,而不是先解决画质。 顺序反了产品就没法上市。
所以社区现在的 cast 玩法更像一种『占位』—— 它说明需求是真的,但真正的 VR 原生形态至少还要一代模型架构。短期内 Genie 进 VR 大概率长成『生成 → 烤资产 → 进引擎』的离线流(A 路径),而不是头显里直接跑(B 路径)。
几个判断
- 60 秒是产品决策,不是技术上限。 长时连贯仍然是世界模型的核心瓶颈(参见 Genie 3 的 demo 漂移问题),但 Google 选择先把短时体验做稳,比追长时漂移更聪明。
- Ultra 独占等于一次定价实验。 把世界模型放在最贵的订阅档下面,是在测『普通用户愿不愿意为可玩世界付溢价』。这个数据比模型质量本身更重要。
- VR 接入是社区自驱的,不是 Google 推动的。 这意味着:一旦官方放出原生 VR 模式,转化曲线会非常陡。
这是世界模型脱离研究语境的第一年——Project Genie 是开局信号,不是终局。