- 上云资讯 -
2025-07-19 17:41:17 47人关注
智源宣布全面开源 RoboBrain 2.0 与 RoboOS 2.0,刷新10项评测基准
智源研究院正式发布了具身智能系统的最新成果 ——RoboBrain2.032B 版本以及跨本体大小脑协同框架 RoboOS2.0单机版。RoboBrain2.0作为一种 “通用具身大脑”,结合了感知、推理和规划的能力,特别是在多项权威基准测试中取得了突破性的成绩。新版本相较于之前的7B 版本,具备了更为强大的时空认知能力,能够在真实物理环境中执行复杂任务。
具身智能系统 RoboBrain2.0 版本特性 跨本体大小脑协同框架 RoboOS2.0 单机版 时空认知能力提升 权威基准测试突破
2025-03-06 16:24:21 361人关注
多模态检索新突破!智源开源多模态向量模型BGE-VL
2025年3月6日,北京智源人工智能研究院宣布开源多模态向量模型BGE-VL,这一成果标志着多模态检索领域的新突破。BGE-VL模型在图文检索、组合图像检索等多模态检索任务中取得了最佳效果,显著提升了多模态检索的性能。
2025-01-23 17:31:10 212人关注
智源与腾讯推出长文本理解基准测试模型LongBench v2
在2024年12月19日的发布会上,智源研究院与腾讯宣布推出LongBench v2,这是一个专为评估大语言模型(LLMs)在真实世界长文本多任务中的深度理解与推理能力而设计的基准测试。该平台旨在推动长文本模型在理解和推理方面的进步,回应了当前长文本大语言模型在应用中的挑战。
2025-01-19 06:44:18 128人关注
Agent再升级!昆仑万维、智源等联合发布计算机控制框架 “Cradle”
昆仑万维与北京智源人工智能研究院、新加坡南洋理工大学、北京大学等机构联合发布了一款名为Cradle的通用计算机控制框架。这一AI框架使智能体(AI Agent)能够无需特别训练,直接像人一样控制键盘和鼠标,与任意开闭源软件进行交互,不依赖任何内部API。Cradle是首个能够同时玩转多种商业游戏和操作各类软件应用的AI框架,其论文、项目和代码均已开源。
2025-01-16 23:20:18 126人关注
智源研究院推出新一代无编码器视觉语言多模态大模型EVE
近期,多模态大模型的研究和应用取得了显著进展。国外公司如OpenAI、Google、Microsoft等推出了一系列先进的模型,国内也有智谱AI、阶跃星辰等机构在该领域取得了突破。这些模型通常依赖视觉编码器来提取视觉特征并与大语言模型结合,但存在训练分离导致的视觉归纳偏置问题,限制了多模态大模型的部署效率和性能。
2025-01-15 03:14:40 93人关注
智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T
北京智源人工智能研究院和中国电信人工智能研究院(TeleAI)联合研发的Tele-FLM系列大模型最近进行了升级,发布了52B指令模型FLM-2-52B-Instruct和全球首个万亿单体稠密模型Tele-FLM-1T,并将相关技术报告和模型的checkpoint开源。
2025-01-05 20:45:36 120人关注
智源研究院推出包含文生视频模型对战评测服务:FlagEval大模型角斗场
2024年9月4日,北京智源人工智能研究院(BAAI)宣布推出全球首个包含文生视频的模型对战评测服务——FlagEval大模型角斗场。
视频生成模型评估 FlagEval模型评测 FlagEval视频生成评测 视频生成模型评测标准 FlagEval评估方法
2025-01-02 23:22:10 128人关注
智源推出下一代检索增强大模型框架MemoRAG
北京智源人工智能研究院与中国人民大学高瓴人工智能学院联合发布了一款创新的人工智能模型框架——MemoRAG。该框架基于长期记忆,旨在推动检索增强生成(RAG)技术的发展,使其能够处理更复杂的任务,而不仅限于简单的问答。
2025-01-01 22:16:22 346人关注
智源推出千万级指令微调数据集Infinity-Instruct
智源研究院推出了一个名为Infinity-Instruct的千万级指令微调数据集,旨在提升语言模型在对话等方面的性能。近日,Infinity Instruct完成了新一轮迭代,包括Infinity-Instruct-7M基础指令数据集和Infinity-Instruct-Gen对话指令数据集。
智源Infinity Instruct数据集 AI大模型训练数据集 大模型指令数据集 Infinity Instruct应用场景 数据集技术原理
2024-12-24 13:30:38 64人关注
智源推出小时级超长视频理解大模型Video-XL
北京智源人工智能研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等高校推出了一款名为Video-XL的超长视频理解大模型。这款模型是多模态大模型核心能力的重要展示,也是向通用人工智能(AGI)迈进的关键步骤。与现有多模态大模型相比,Video-XL在处理超过10分钟的长视频时,展现了更优的性能和效率。