智源发布多模态世界大模型 Emu3.5,以自回归方式实现了对多模态序列的“Next-State Prediction (NSP)”,获得了可泛化的世界建模能力。在场景应用层面,模型不仅能实现跨场景的具身操作、具备泛化的动作规划与复杂交互能力,也能完成文图生成、图片编辑与时空变换。
智源发布多模态世界大模型悟界·Emu3.5,可实现跨场景具身操作
2025-10-31 10:55 来源:星元科技
智源发布多模态世界大模型 Emu3.5,以自回归方式实现了对多模态序列的“Next-State Prediction (NSP)”,获得了可泛化的世界建模能力。在场景应用层面,模型不仅能实现跨场景的具身操作、具备泛化的动作规划与复杂交互能力,也能完成文图生成、图片编辑与时空变换。