上云资讯 - 来上云吧，企业上云一站式服务

2025-10-30 16:36:26 241人关注

智源发布Emu3.5大模型：以“下一状态预测”重构多模态智能，具身操作能力惊艳业界

当大模型不再只是“看图说话”或“文生图”，而是能像人类一样在复杂环境中理解、规划并执行跨模态操作，多模态AI正迎来质的飞跃。10月30日，北京智源人工智能研究院正式发布其新一代多模态世界模型——Emu3.5，首次将自回归式“下一状态预测”（Next-State Prediction， NSP）引入多模态序列建模，标志着AI从“感知理解”迈向“智能操作”的关键一步。

AI

2025-08-30 09:17:29 303人关注

PPIO 姚欣：AI创业者必备的 “PDA” 思维，助力全球智能体革命！

在8月26日的首届 “AI 国际人才峰会” 上，PPIO 联合创始人兼 CEO 姚欣分享了他对 AI 时代创业者必备特质的深刻见解。这场由香港投资管理有限公司与北京智源人工智能研究院共同主办的峰会，汇聚了全球 AI 领域的顶尖专家和青年学者，讨论 AI 技术的前沿发展和产业实践。

AI国际人才峰会 AI时代创业者特质 PPIO姚欣香港投资管理有限公司北京智源人工智能研究院 AI前沿发展 AI产业实践

2025-07-19 17:41:17 428人关注

智源宣布全面开源 RoboBrain 2.0 与 RoboOS 2.0，刷新10项评测基准

智源研究院正式发布了具身智能系统的最新成果 ——RoboBrain2.032B 版本以及跨本体大小脑协同框架 RoboOS2.0单机版。RoboBrain2.0作为一种 “通用具身大脑”，结合了感知、推理和规划的能力，特别是在多项权威基准测试中取得了突破性的成绩。新版本相较于之前的7B 版本，具备了更为强大的时空认知能力，能够在真实物理环境中执行复杂任务。

具身智能系统 RoboBrain2.0 版本特性跨本体大小脑协同框架 RoboOS2.0 单机版时空认知能力提升权威基准测试突破

2025-07-15 13:20:37 586人关注

A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

AI日报人工智能热点 AI技术趋势创新AI产品应用 AI开发者指南

2025-03-06 16:24:21 762人关注

多模态检索新突破！智源开源多模态向量模型BGE-VL

2025年3月6日，北京智源人工智能研究院宣布开源多模态向量模型BGE-VL，这一成果标志着多模态检索领域的新突破。BGE-VL模型在图文检索、组合图像检索等多模态检索任务中取得了最佳效果，显著提升了多模态检索的性能。

多模态检索 BGE-VL 多模态检索技术突破 BGE-VL模型应用多模态检索最新进展

2025-01-23 17:31:10 612人关注

智源与腾讯推出长文本理解基准测试模型LongBench v2

在2024年12月19日的发布会上，智源研究院与腾讯宣布推出LongBench v2，这是一个专为评估大语言模型（LLMs）在真实世界长文本多任务中的深度理解与推理能力而设计的基准测试。该平台旨在推动长文本模型在理解和推理方面的进步，回应了当前长文本大语言模型在应用中的挑战。

智源腾讯 LongBench V2 大模型评测 AI评测基准

2025-01-23 02:45:15 289人关注

智源研究院与腾讯达成战略合作推动大模型、AI等应用落地

智源研究院与腾讯集团于2024年12月18日签署了战略合作协议，双方将在大模型研发、人工智能技术前沿探索及开源生态建设等多个领域进行深入合作。

腾讯AI合作研究院合作 AI技术合作腾讯AI研究院产学研合作

2025-01-20 10:37:37 189人关注

智源开源无标注视频学习3D生成模型See3D

北京智源人工智能研究院（BAAI）近日宣布推出一款创新的3D生成模型See3D，该模型能够利用大规模无标注的互联网视频进行学习。这一技术突破标志着向“See Video， Get3D”的理念迈进了重要一步。See3D模型不依赖于传统的相机参数，而是采用视觉条件技术，仅通过视频中的视觉线索生成相机方向可控且几何一致的多视角图像。这种方法避免了昂贵的3D或相机标注的需求，能够高效地从互联网视频中学习3D先验。

无监督视频学习 See3D 视频学习技术无监督学习算法视频分析模型

2025-01-19 06:44:18 363人关注

Agent再升级！昆仑万维、智源等联合发布计算机控制框架 “Cradle”

昆仑万维与北京智源人工智能研究院、新加坡南洋理工大学、北京大学等机构联合发布了一款名为Cradle的通用计算机控制框架。这一AI框架使智能体（AI Agent）能够无需特别训练，直接像人一样控制键盘和鼠标，与任意开闭源软件进行交互，不依赖任何内部API。Cradle是首个能够同时玩转多种商业游戏和操作各类软件应用的AI框架，其论文、项目和代码均已开源。

AI大模型大模型技术原理大模型技术架构 AI 工程师必备协议知识 AI 协议的工程应用场景

2025-01-16 23:20:18 419人关注

智源研究院推出新一代无编码器视觉语言多模态大模型EVE

近期，多模态大模型的研究和应用取得了显著进展。国外公司如OpenAI、Google、Microsoft等推出了一系列先进的模型，国内也有智谱AI、阶跃星辰等机构在该领域取得了突破。这些模型通常依赖视觉编码器来提取视觉特征并与大语言模型结合，但存在训练分离导致的视觉归纳偏置问题，限制了多模态大模型的部署效率和性能。

EVE编码器无编码器视觉语言模型多模态模型技术视觉语言融合模型多模态AI架构

2025-01-15 03:14:40 277人关注

智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T

北京智源人工智能研究院和中国电信人工智能研究院（TeleAI）联合研发的Tele-FLM系列大模型最近进行了升级，发布了52B指令模型FLM-2-52B-Instruct和全球首个万亿单体稠密模型Tele-FLM-1T，并将相关技术报告和模型的checkpoint开源。

万亿参数大模型密集模型技术 FLM大模型架构 Tele-FLM模型解析大模型参数优化

2025-01-14 13:29:21 590人关注

智源发布三款BGE新模型刷新向量检索最佳水平

智源研究院最近发布了三款新的向量模型，这些模型在向量检索任务中表现出色，并刷新了多个评测基准的最佳水平。这三款模型分别是:

智源BGE模型向量检索技术向量检索模型大模型向量检索应用 BGE模型检索性能

2025-01-05 20:45:36 318人关注

智源研究院推出包含文生视频模型对战评测服务：FlagEval大模型角斗场

2024年9月4日，北京智源人工智能研究院（BAAI）宣布推出全球首个包含文生视频的模型对战评测服务——FlagEval大模型角斗场。

视频生成模型评估 FlagEval模型评测 FlagEval视频生成评测视频生成模型评测标准 FlagEval评估方法

2025-01-02 23:22:10 327人关注

智源推出下一代检索增强大模型框架MemoRAG

北京智源人工智能研究院与中国人民大学高瓴人工智能学院联合发布了一款创新的人工智能模型框架——MemoRAG。该框架基于长期记忆，旨在推动检索增强生成（RAG）技术的发展，使其能够处理更复杂的任务，而不仅限于简单的问答。

下一代检索增强模型框架 MemorAG框架检索增强模型技术大模型框架优化 AI模型检索增强方法

2025-01-01 22:16:22 678人关注

智源推出千万级指令微调数据集Infinity-Instruct

智源研究院推出了一个名为Infinity-Instruct的千万级指令微调数据集，旨在提升语言模型在对话等方面的性能。近日，Infinity Instruct完成了新一轮迭代，包括Infinity-Instruct-7M基础指令数据集和Infinity-Instruct-Gen对话指令数据集。

智源Infinity Instruct数据集 AI大模型训练数据集大模型指令数据集 Infinity Instruct应用场景数据集技术原理

2025-01-01 15:43:25 231人关注

百度与智源研究院达成战略协议将在大模型等领域展开合作

北京百度网讯科技有限公司与北京智源人工智能研究院今日宣布正式签署战略合作协议，双方将在大模型等领域展开深度合作，共同构建人工智能产研协同生态。

百度智缘战略合作 AI战略合作百度AI合作智缘AI技术合作百度智缘新闻

2025-01-01 09:41:13 284人关注

智源研究院发布中文互联网语料库CCI3.0 包含1000GB数据集

在2024北京文化论坛上，北京智源人工智能研究院（BAAI）宣布正式发布新一代中文互联网语料库CCI3.0(Chinese Corpora Internet)，进一步推动数据共建共享。CCI3.0包含1000GB的数据集及498GB的高质量子集CCI3.0-HQ，是继2023年11月首次开源CCI1.0和2024年4月发布CCI2.0之后的又一次重要更新。

智源研究院 CCI3语料库 1000GB语料大模型训练数据中文语料库人工智能数据集

2024-12-30 20:33:20 370人关注

智源研究院推出全球首个中文大模型辩论平台FlagEval Debate

北京智源人工智能研究院（BAAI）最近推出了全球首个中文大模型辩论平台FlagEval Debate。这一新平台旨在通过模型辩论这一竞争机制，为大语言模型的能力评估提供新的度量方式。它是智源模型对战评测服务FlagEval大模型角斗场的扩展，目标是甄别大语言模型之间的能力差异。

Flageval 中文大模型大模型评测大模型辩论大模型技术评估中文模型性能对比

2024-12-26 16:13:14 271人关注

重新定义多模态AI！智源发布原生多模态世界模型Emu3

北京智源人工智能研究院宣布推出原生多模态世界模型Emu3。这一模型基于下一个token预测技术，无需依赖扩散模型或组合方法，就能够完成文本、图像、视频三种模态数据的理解和生成。Emu3在图像生成、视频生成、视觉语言理解等任务中超过了现有的知名开源模型，如SDXL、LLaVA、OpenSora等，展现了卓越的性能。

多模态AI 智源Emu3 AI大模型多模态技术 AI技术前沿人工智能创新

2024-12-26 14:27:37 249人关注

颠覆 Stable Diffusion！智源重磅发布 Emu3，图像、文本、视频全拿下！

来自智源研究院的Emu3团队发布了一套全新的多模态模型Emu3，该模型仅基于下一个token预测进行训练，颠覆了传统的扩散模型和组合模型架构，在生成和感知任务上均取得了最先进的性能。

Stable Diffusion Emu3 AI图像生成 AI文本生成 AI视频生成多模态AI技术

- 上云资讯 -

智源发布Emu3.5大模型：以“下一状态预测”重构多模态智能，具身操作能力惊艳业界

PPIO 姚欣：AI创业者必备的 “PDA” 思维，助力全球智能体革命！

智源宣布全面开源 RoboBrain 2.0 与 RoboOS 2.0，刷新10项评测基准

A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

多模态检索新突破！智源开源多模态向量模型BGE-VL

智源与腾讯推出长文本理解基准测试模型LongBench v2

智源研究院与腾讯达成战略合作推动大模型、AI等应用落地

智源开源无标注视频学习3D生成模型See3D

Agent再升级！昆仑万维、智源等联合发布计算机控制框架 “Cradle”

智源研究院推出新一代无编码器视觉语言多模态大模型EVE

智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T

智源发布三款BGE新模型刷新向量检索最佳水平

智源研究院推出包含文生视频模型对战评测服务：FlagEval大模型角斗场

智源推出下一代检索增强大模型框架MemoRAG

智源推出千万级指令微调数据集Infinity-Instruct

百度与智源研究院达成战略协议将在大模型等领域展开合作

智源研究院发布中文互联网语料库CCI3.0 包含1000GB数据集

智源研究院推出全球首个中文大模型辩论平台FlagEval Debate

重新定义多模态AI！智源发布原生多模态世界模型Emu3

颠覆 Stable Diffusion！智源重磅发布 Emu3，图像、文本、视频全拿下！

推荐阅读

上云服务

- 上云资讯 -

智源发布Emu3.5大模型：以“下一状态预测”重构多模态智能，具身操作能力惊艳业界

PPIO 姚欣：AI创业者必备的 “PDA” 思维，助力全球智能体革命！

智源宣布全面开源 RoboBrain 2.0 与 RoboOS 2.0，刷新10项评测基准

A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

多模态检索新突破！智源开源多模态向量模型BGE-VL

智源与腾讯推出长文本理解基准测试模型LongBench v2

智源研究院与腾讯达成战略合作 推动大模型、AI等应用落地

智源开源无标注视频学习3D生成模型See3D

Agent再升级！昆仑万维、智源等联合发布计算机控制框架 “Cradle”

智源研究院推出新一代无编码器视觉语言多模态大模型EVE

智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T

智源发布三款BGE新模型 刷新向量检索最佳水平

智源研究院推出包含文生视频模型对战评测服务：FlagEval大模型角斗场

智源推出下一代检索增强大模型框架MemoRAG

智源推出千万级指令微调数据集Infinity-Instruct

百度与智源研究院达成战略协议 将在大模型等领域展开合作

智源研究院发布中文互联网语料库CCI3.0 包含1000GB数据集

智源研究院推出全球首个中文大模型辩论平台FlagEval Debate

重新定义多模态AI！智源发布原生多模态世界模型Emu3

颠覆 Stable Diffusion！智源重磅发布 Emu3，图像、文本、视频全拿下！

推荐阅读

上云服务

智源研究院与腾讯达成战略合作推动大模型、AI等应用落地

智源发布三款BGE新模型刷新向量检索最佳水平

百度与智源研究院达成战略协议将在大模型等领域展开合作