
MIDI
AI 3D场景生成工具,可从单张图像高效生成包含多个对象的完整3D环境,广泛应用于VR/AR、游戏开发、影视制作等领域。
Lyra 2.0是英伟达于2026年4月16日发布的3D场景生成系统,其核心突破在于仅需单张照片即可生成跨度约90米、高连贯性的虚拟环境。该系统解决了传统模型在长距离相机移动时出现的“空间遗忘”(场景细节丢失)和“时间漂移”(物体位置偏移)两大难题。
技术上,Lyra 2.0采用双重策略:一是实时存储每帧的3D几何信息,确保相机重回旧位时环境一致;二是在训练中引入缺陷输出,使模型具备自我纠偏能力。其生成的3D场景支持交互式探索,并可导出为网格格式,直接应用于机器人仿真训练、游戏开发及虚拟场景构建等领域。
实验显示,Lyra 2.0在图像质量、风格一致性等指标上超越了GEN3C、CaM等竞品,为3D内容创作和物理AI训练提供了高效工具。
| 产品 | 生成范围 | 连贯性 | 生成速度 | 核心优势 |
|---|---|---|---|---|
| Lyra 2.0 | 90米 | 98% | 快速 | 长距离连贯性、自暴露训练、自蒸馏技术、开源 |
| Google Instant NeRF | 约10米 | 较低 | 较慢 | 基于NeRF架构,但生成范围和连贯性不如Lyra 2.0 |
| Meta SAM 3D | 未明确 | 92% | 中等 | 支持自然语言指令生成场景,但在连贯性和范围上未达到Lyra 2.0的水平 |
| LGM (Large Gaussian Model) | 未明确 | 短时程 | 未明确 | 专注于静态物体生成,长时程生成能力不如Lyra 2.0 |
| TripoSR | 未明确 | 中等 | 极快(<1秒) | 适合快速预览,但场景复杂度和生成质量不如Lyra 2.0 |
| WonderJourney | 未明确 | 有限 | 中等 | 支持可探索性,但生成质量和开源程度不如Lyra 2.0 |
Lyra 2.0 的发布标志着 3D生成技术 进入了一个新的里程碑。其 单张照片生成90米连贯3D环境 的能力,结合 长距离一致性 和 自暴露训练 等核心技术,使其在 游戏开发、数字孪生、影视制作、VR/AR、房地产 和 机器人仿真训练 等多个领域具有广泛的应用前景。与同类产品相比,Lyra 2.0 在 生成范围、连贯性 和 开源程度 等方面具有明显优势,有望推动 3D生成技术 的普及和工业化应用。







