- 上云资讯 -
2025-09-16 17:17:32 29人关注
Meta AI 发布 MobileLLM-R1:轻量级边缘推理模型,参数不足 10 亿,性能提升显著
Meta AI 近日推出了 MobileLLM-R1,这是一系列轻量级边缘推理模型,目前已在 Hugging Face 上发布。该系列模型参数范围从140M 到950M,专注于高效的数学、编码和科学推理,且在不足10亿的参数规模下实现了优秀的性能表现。
2025-09-08 10:18:16 43人关注
微软推出新型 AI Agent 模型 rStar2-Agent,以 140 亿参数挑战大规模模型
微软最近在 AI 领域取得了显著突破,开源了一款名为 rStar2-Agent 的 AI Agent 推理模型。这款模型采用了创新的智能体强化学习方法,令人惊讶的是,尽管其参数仅有140亿,但在 AIME24数学推理测试中,准确率高达80.6%,成功超越了拥有6710亿参数的 DeepSeek-R1(79.8%)。这样的表现让人们重新思考模型的参数规模与性能之间的关系。
2025-08-25 12:18:10 57人关注
Cohere推出全新模型Command A Reasoning,专为企业级复杂推理任务打造
Cohere 近日发布了其全新的语言模型 Command A Reasoning,旨在满足商业环境中对高难度推理任务的严苛需求。该模型在处理代理工作流、构建端到端系统和分析大型文档方面表现出色。
2025-08-23 11:32:18 45人关注
刷新科技前沿!InternLM推出8B参数的轻量级多模态推理模型
近日,InternLM 团队正式发布了其开源的轻量级多模态推理模型 ——Intern-S1-mini。该模型参数仅为8B,结合了先进的 Qwen3-8B 语言模型与0.3B 视觉编码器 InternViT,展现出强大的处理能力和灵活性。
InternLM开源模型 轻量级多模态推理 Intern-S1-mini参数 Qwen3-8B语言模型 InternViT视觉编码器
2025-08-12 13:11:10 69人关注
英伟达发布全新 Cosmos Reason 模型,加速机器人与物理 AI 发展
英伟达周一在 SIGGRAPH 大会上发布了一系列面向机器人开发者的全新世界 AI 模型、库及基础设施,其中最引人关注的是参数规模达70亿的“推理型”视觉语言模型 Cosmos Reason,专为物理 AI 应用与机器人设计。
英伟达SIGGRAPH大会 机器人开发者AI模型 Cosmos Reason视觉语言模型 物理AI应用 70亿参数推理模型 机器人AI基础设施
2025-08-08 18:11:15 65人关注
百度再出重磅消息!新推理模型与文心5.0大模型即将来袭!
近日,《华尔街日报》爆料,百度计划在2025年8月底之前推出一款全新的推理模型,旨在应对日益激烈的市场竞争,尤其是与 DeepSeek 和 Open 等科技巨头的竞争。这款新模型将具备更强的能力,能够处理更加复杂的任务,为用户提供更高效的服务。
百度推理模型 推理模型市场竞争 DeepSeek 竞争模型 Open 科技巨头竞争 2025年AI模型发布 复杂任务处理AI
2025-08-08 09:17:14 59人关注
消息称百度 8 月底前将发布新AI推理模型 文心5.0未来数月推出
据报道,百度正在加速推进其文心大模型的更新计划。消息人士透露,百度最快将于8月底推出文心大模型的最新版推理模型,目前该模型正处于紧张的测试阶段。这一新版本在逻辑推理和复杂计算等关键能力上有望超越OpenAI的o3满血版。
百度文心大模型 文心大模型更新计划 文心大模型推理模型 文心大模型逻辑推理能力 文心大模型复杂计算能力 文心大模型与OpenAI对比
2025-08-07 14:13:25 66人关注
AMD、高通宣布旗下硬件支持 gpt-oss 系列开放模型
近日,AMD 与高通联合宣布,旗下硬件正式支持 OpenAI 推出的 gpt-oss 系列开放推理模型,标志着边缘计算和 AI 的结合迈出了重要一步。OpenAI 新发布的 gpt-oss 系列包括两个模型:参数较少的 gpt-oss-20b 和更复杂的 gpt-oss-120b。前者可以在配备16GB 内存的设备上流畅运行,而后者则能在单个80GB 显卡上高效执行。
AMD 高通联合支持 gpt-oss OpenAI gpt-oss 系列模型 gpt-oss-20b 16GB 内存运行 gpt-oss-120b 80GB 显卡需求 边缘计算 AI 推理模型
2025-08-06 11:36:35 51人关注
打破僵局!OpenAI 模型首次登陆 AWS,云计算AI版图再掀波澜!
人工智能巨头 OpenAI 与亚马逊网络服务(AWS)正式宣布建立前所未有的合作伙伴关系,共同推出两款性能媲美其“O系列”的全新开源推理模型。据 OpenAI 模型产品负责人德米特里·皮梅诺夫(Dmitry Pimenov)透露,这些模型已在 AWS 上线,标志着 AWS 首次正式提供 OpenAI 模型。此举不仅为云计算市场投下了一枚重磅炸弹,也加剧了科技巨头在 AI 领域的激烈竞争。
2025-07-28 13:35:27 164人关注
阿里巴巴重磅发布三款开源大模型,未来AI将更加智能!
在2025年世界人工智能大会(WAIC)上,阿里巴巴带来了三款全新开源大模型,这一消息无疑为全球 AI 领域注入了一剂强心针。此次发布的模型涵盖了基础模型、编程模型和推理模型,三者都赢得了全球开源领域的最高荣誉,标志着阿里在开源技术上的强大实力。
2025-07-18 12:40:20 88人关注
Mistral AI 聊天机器人 Le Chat 重磅更新:深度研究、语音交互与高级图像编辑功能上线
Mistral AI 的聊天机器人 Le Chat 近日迎来重大更新,新增五项核心功能,显著提升用户体验和应用范围。此次更新整合了多种专门模型,例如用于语音交互的 Voxtral 模型 和用于逻辑推理的 Magistral 模型。
Mistral AI Le Chat 聊天机器人 Mistral AI 新功能 Voxtral 语音交互模型 Magistral 逻辑推理模型 Le Chat 用户体验提升
2025-07-03 09:22:45 197人关注
智谱AI开源GLM-4.1V-Thinking:多模态推理模型再突破
智谱AI正式开源最新一代通用视觉模型GLM-4.1V-Thinking,基于GLM-4V架构,新增思维链推理机制,显著提升复杂认知任务能力。该模型支持图像、视频、文档等多模态输入,擅长长视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent及代码生成等多样化场景,覆盖千行百业的应用需求。
2025-06-22 08:31:17 178人关注
蚂蚁开源轻量级MoE推理模型Ring-lite
近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。
2025-06-18 11:23:20 143人关注
MiniMax 推出全球首个开源混合架构模型 M1,强化训练成本大幅降低!
6月17日,上海的 AI 独角兽公司 MiniMax 发布了其全新研发的 MiniMax-M1系列模型,号称是全球首个开源的大规模混合架构推理模型。这个创新的模型在上下文处理能力和成本控制方面都取得了显著的突破。
MiniMax-M1系列模型 大规模混合架构推理模型 AI独角兽公司MiniMax 上下文处理能力提升 开源大模型成本控制
2025-06-17 12:38:39 206人关注
MiniMax-M1开源:全球首个大规模混合架构推理模型
近日,MiniMax公司宣布推出其全新模型MiniMax-M1,该模型作为世界上首个开源的大规模混合架构推理模型,在面向生产力的复杂场景中展现出了卓越性能,成为开源模型中的佼佼者。MiniMax-M1不仅超越了国内闭源模型,还接近了海外最领先模型的水平,同时保持着业内最高的性价比。
MiniMax-M1 开源大规模混合架构推理模型 开源模型性能对比 MiniMax-M1性价比优势 生产力场景AI模型 国内AI模型开源突破
2025-06-14 15:37:14 193人关注
Mistral AI携手英伟达,打造“主权”AI基础设施与顶尖推理模型
法国人工智能初创公司Mistral AI周三宣布全面进军人工智能基础设施领域,将其公司定位为欧洲对美国云计算巨头的有力回应。与此同时,该公司还推出了可与OpenAI最先进系统相媲美的新型推理模型。