- 上云资讯 -
                
                
                
                    阿里云云原生
                
                
                
                    阿里云开发者
                
                
                
                    腾讯云开发者
                
                
                
                    火山引擎开发者社区
                
                
                
                    魔搭ModelScope社区
                
                
                
                    微软科技
                
                
                
                    Azure云科技
                
                
                
                    Zilliz
                
                
                
                    OpenAI
                
                
                
                    Anthropic
                
                
                
                    Gemini
                
                
                
                    LangChain
                
                
                
                    Hugging Face
                
                
                
                    Mistral
                
                
            
            
            
                2025-10-30 16:36:26 69人关注
智源发布Emu3.5大模型:以“下一状态预测”重构多模态智能,具身操作能力惊艳业界
当大模型不再只是“看图说话”或“文生图”,而是能像人类一样在复杂环境中理解、规划并执行跨模态操作,多模态AI正迎来质的飞跃。10月30日,北京智源人工智能研究院正式发布其新一代多模态世界模型——Emu3.5,首次将自回归式“下一状态预测”(Next-State Prediction, NSP)引入多模态序列建模,标志着AI从“感知理解”迈向“智能操作”的关键一步。
