- 上云资讯 -
2025-07-28 13:35:27 62人关注
阿里巴巴重磅发布三款开源大模型,未来AI将更加智能!
在2025年世界人工智能大会(WAIC)上,阿里巴巴带来了三款全新开源大模型,这一消息无疑为全球 AI 领域注入了一剂强心针。此次发布的模型涵盖了基础模型、编程模型和推理模型,三者都赢得了全球开源领域的最高荣誉,标志着阿里在开源技术上的强大实力。
2025-07-18 12:40:20 51人关注
Mistral AI 聊天机器人 Le Chat 重磅更新:深度研究、语音交互与高级图像编辑功能上线
Mistral AI 的聊天机器人 Le Chat 近日迎来重大更新,新增五项核心功能,显著提升用户体验和应用范围。此次更新整合了多种专门模型,例如用于语音交互的 Voxtral 模型 和用于逻辑推理的 Magistral 模型。
Mistral AI Le Chat 聊天机器人 Mistral AI 新功能 Voxtral 语音交互模型 Magistral 逻辑推理模型 Le Chat 用户体验提升
2025-07-03 09:22:45 118人关注
智谱AI开源GLM-4.1V-Thinking:多模态推理模型再突破
智谱AI正式开源最新一代通用视觉模型GLM-4.1V-Thinking,基于GLM-4V架构,新增思维链推理机制,显著提升复杂认知任务能力。该模型支持图像、视频、文档等多模态输入,擅长长视频理解、图像问答、学科解题、文字识别、文档解读、Grounding、GUI Agent及代码生成等多样化场景,覆盖千行百业的应用需求。
2025-06-22 08:31:17 116人关注
蚂蚁开源轻量级MoE推理模型Ring-lite
近日,蚂蚁技术团队宣布正式开源其轻量级推理模型Ring-lite。该模型在多项推理榜单上取得了显著成绩,实现了轻量级推理模型的SOTA效果,再次验证了MoE架构的推理潜力。
2025-06-18 11:23:20 80人关注
MiniMax 推出全球首个开源混合架构模型 M1,强化训练成本大幅降低!
6月17日,上海的 AI 独角兽公司 MiniMax 发布了其全新研发的 MiniMax-M1系列模型,号称是全球首个开源的大规模混合架构推理模型。这个创新的模型在上下文处理能力和成本控制方面都取得了显著的突破。
MiniMax-M1系列模型 大规模混合架构推理模型 AI独角兽公司MiniMax 上下文处理能力提升 开源大模型成本控制
2025-06-17 12:38:39 158人关注
MiniMax-M1开源:全球首个大规模混合架构推理模型
近日,MiniMax公司宣布推出其全新模型MiniMax-M1,该模型作为世界上首个开源的大规模混合架构推理模型,在面向生产力的复杂场景中展现出了卓越性能,成为开源模型中的佼佼者。MiniMax-M1不仅超越了国内闭源模型,还接近了海外最领先模型的水平,同时保持着业内最高的性价比。
MiniMax-M1 开源大规模混合架构推理模型 开源模型性能对比 MiniMax-M1性价比优势 生产力场景AI模型 国内AI模型开源突破
2025-06-14 15:37:14 132人关注
Mistral AI携手英伟达,打造“主权”AI基础设施与顶尖推理模型
法国人工智能初创公司Mistral AI周三宣布全面进军人工智能基础设施领域,将其公司定位为欧洲对美国云计算巨头的有力回应。与此同时,该公司还推出了可与OpenAI最先进系统相媲美的新型推理模型。
2025-06-11 11:22:40 130人关注
法国 AI 实验室 Mistral 发布全新推理模型 Magistral,Small 版已开放下载
法国人工智能实验室 Mistral 近日宣布正式推出其首个推理模型系列 ——Magistral。该系列包括 Magistral Small 和 Magistral Medium 两个版本,旨在提升在数学、物理等学科领域的逻辑推理能力。Mistral 表示,Magistral 系列模型通过分步骤解决问题,以期提高结果的一致性和可靠性。
2025-06-06 14:41:24 530人关注
OpenAI 发布 GPT-4.5:迄今最强大模型亮相 强化推理与情感智能
2025年2月27日—— OpenAI 于今日正式推出其最新语言模型 GPT-4.5,作为研究预览版率先提供给 ChatGPT Pro 用户(每月订阅费200美元)。这款被誉为“迄今为止最大、最知识渊博”的模型基于 GPT-4o 构建,在推理能力、情感智能以及写作、编程等实用功能上实现显著提升。OpenAI 表示,未来几周内,GPT-4.5将逐步开放给 Plus、Team、Enterprise 和 Edu 用户,标志着人工智能技术的又一里程碑。
2025-05-27 10:38:45 194人关注
阿里突破性发布QwenLong-L1-32B:首个强化学习训练的长文本推理模型,性能媲美Claude-3.7
阿里巴巴今日正式发布QwenLong-L1-32B,这是一款专为长上下文推理设计的大型语言模型,标志着AI长文本处理能力的重大突破。该模型在性能表现上超越了o3-mini和Qwen3-235B-A22B,与Claude-3.7-Sonnet-Thinking达到相当水平。
阿里巴巴通义千问L1-32B 强化学习长文本模型 通义千问L1-32B模型 阿里巴巴大模型 长文本处理技术 强化学习模型应用
2025-05-20 10:41:33 100人关注
阿里通义千问推出推理模型QwQ-Max预览版 可在qwen.ai域名体验
2月25日,阿里巴巴宣布推出基于Qwen2.5-Max的推理模型QwQ-Max-Preview,并计划全面开源其最新推理模型QwQ-Max和Qwen2.5-Max。
2025-05-19 16:22:25 52人关注
Anthropic推出混合推理模型Claude 3.7 Sonnet:能力超DeepSeek
今日,人工智能公司Anthropic宣布正式推出其最新的“混合推理模型”——Claude3.7Sonnet。这款模型被Anthropic誉为有史以来“最智能”的AI模型,旨在解决更复杂的问题,并在数学和编码等领域展现出超越以往的性能。
Anthropic Claude 3.7 DeepSeek AI大模型 Claude 3.7 Sonnet Anthropic最新模型 大模型技术进展
2025-05-19 14:10:22 101人关注
AI编程工具Cursor已集成Claude 3.7 Sonnet推理模型
刚刚,Cursor AI宣布已集成Claude 3.7 Sonnet,并更新了用户界面,使其更加简洁易用。此外,Cursor还引入了跨聊天对话功能,能够自动总结聊天摘要并继承到新开的聊天窗口中,进一步提升了用户体验。
2025-05-10 10:15:25 75人关注
深推理模型崛起!Together AI融资3.05亿美元助推GPU需求
在 AI 行业,Together AI 最近宣布完成了一轮3.05亿美元的 B 轮融资,这一消息引起了广泛关注。该公司的崛起与其新推出的深度理模型 DeepSeek-R1密切相关。与最初的担忧相反,许行业专家认为,深度推理的进步并没有降低对基础设施的需求,反而在不断提升这一需求。
2025-05-02 16:27:36 96人关注
小身材,大智慧!微软Phi-4系列推理模型发布,性能直逼GPT-4o
微软正积极扩展其Phi系列紧凑型语言模型,最新发布了三款专为高级推理任务设计的新变体:Phi-4-reasoning、Phi-4-reasoning-plus 和 Phi-4-mini-reasoning。这些模型旨在通过结构化推理和内部反思处理复杂的问答,同时保持轻量级特性,使其能够在包括移动设备在内的低端硬件上高效运行,延续了微软Phi系列在资源受限设备上实现强大AI功能的愿景。