微信扫码
添加专属顾问
2024-12-26 14:18:20 42人关注
智源研究院正式发布了他们的新一代多模态世界模型 Emu3,该模型的最大亮点在于,它仅依靠下一个 token 的预测能力,就能在文本、图像和视频这三种不同模态中进行理解和生成。
多模态世界模型 Emu3 Token预测 大模型技术 AI多模态技术 Emu3应用场景