2024-12-26 16:13:14
                        159人关注
                    
                    重新定义多模态AI!智源发布原生多模态世界模型Emu3
                    北京智源人工智能研究院宣布推出原生多模态世界模型Emu3。这一模型基于下一个token预测技术,无需依赖扩散模型或组合方法,就能够完成文本、图像、视频三种模态数据的理解和生成。Emu3在图像生成、视频生成、视觉语言理解等任务中超过了现有的知名开源模型,如SDXL、LLaVA、OpenSora等,展现了卓越的性能。
                    
                        
                        多模态AI
                        
                        智源Emu3
                        
                        AI大模型
                        
                        多模态技术
                        
                        AI技术前沿
                        
                        人工智能创新