上云资讯 - 来上云吧，企业上云一站式服务

2025-09-08 10:18:16 239人关注

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

微软最近在 AI 领域取得了显著突破，开源了一款名为 rStar2-Agent 的 AI Agent 推理模型。这款模型采用了创新的智能体强化学习方法，令人惊讶的是，尽管其参数仅有140亿，但在 AIME24数学推理测试中，准确率高达80.6%，成功超越了拥有6710亿参数的 DeepSeek-R1（79.8%）。这样的表现让人们重新思考模型的参数规模与性能之间的关系。

AI Agent 推理模型智能体强化学习模型参数规模与性能数学推理测试小参数模型优势开源AI模型

2025-09-02 08:16:39 518人关注

美团发布 LongCat-Flash-Chat：560B 参数模型再创新高，智能体表现惊艳！

近日，美团正式发布并开源了其最新的 AI 大模型 ——LongCat-Flash-Chat。这款模型以560B 的总参数量和18.6B 到31.3B 的激活参数范围，展现了其在计算效率与性能之间的优越平衡。LongCat-Flash 采用了创新的混合专家模型（MoE）架构，利用 “零计算专家” 机制，使得每个 token 在处理时仅激活必要的参数，确保算力高效利用。

美团AI大模型 LongCat-Flash-Chat 混合专家模型架构 MoE架构优势零计算专家机制大模型参数优化

2025-03-01 16:14:38 373人关注

微软论文再曝OpenAI模型参数？医疗AI评测意外暴露4o-mini只有8B

在一篇聚焦医疗AI评测的研究论文中，微软似乎再次"不经意"地披露了业界多个顶级大语言模型的参数规模。这份发布于12月26日的论文不仅揭示了包括OpenAI、Anthropic在内的多家公司的模型参数数据，还引发了业内对模型架构和技术实力的热议。

Microsoft OpenAI 模型参数医疗AI评估 AI模型评估大模型技术

2025-01-28 04:14:38 352人关注

全球首个亿级参数地震波大模型 “谛听” 发布，2025 年将全面开放

在地震监测和分析领域，一项重大的技术突破于1月17日在国家超级计算机成都中心正式发布。全球首个亿级参数量的地震波大模型 ——“谛听” 大模型的第三阶段测试版本已经上线。这一模型由国家超级计算机成都中心、中国地震局地球物理研究所以及清华大学联合开发，标志着我国在地震研究技术上的一次飞跃。

全球首个十亿参数地震波模型地震波模型技术突破十亿参数模型应用地震波预测技术地震模型参数优化

2025-01-16 16:18:10 259人关注

微软Q-Sparse模型：8B参数性能直逼7B模型训练微调轻松搞定！

在人工智能的世界里，大型语言模型（LLMs）以其卓越的自然语言处理能力而著称。然而，这些模型在实际应用中的部署却面临着巨大的挑战，主要是因为它们在推理阶段的高计算成本和内存占用。为了解决这一问题，研究人员们一直在探索如何提高LLMs的效率。最近，一种名为Q-Sparse的方法引起了广泛关注。

Microsoft Q-Sparse模型 8B参数大模型稀疏模型技术大模型参数优化微软AI模型创新

2025-01-16 00:36:14 343人关注

震惊AI界！Llama 3.1泄露：4050亿参数的开源巨兽来袭！

Llama3.1泄露了!你没听错，这个拥有4050亿参数的开源模型，已经在Reddit上引起了轩然大波。这可能是迄今为止最接近GPT-4o的开源模型，甚至在某些方面超越了它。

Llama 3 1泄露 4050亿参数模型 Llama 3泄露细节大模型参数规模大模型技术新闻

2025-01-15 03:14:40 277人关注

智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T

北京智源人工智能研究院和中国电信人工智能研究院（TeleAI）联合研发的Tele-FLM系列大模型最近进行了升级，发布了52B指令模型FLM-2-52B-Instruct和全球首个万亿单体稠密模型Tele-FLM-1T，并将相关技术报告和模型的checkpoint开源。

万亿参数大模型密集模型技术 FLM大模型架构 Tele-FLM模型解析大模型参数优化

2024-12-21 10:38:45 329人关注

小巧强大！口袋级视觉AI模型moondream2：仅有16亿参数，手机就能运行

最近，西雅图的一家初创公司 Moondream 推出了名为 moondream2的紧凑型视觉语言模型。尽管体积小巧，但该模型在各项基准测试中表现出色，备受关注。作为一个开源模型，moondream2有望在智能手机上实现本地图像识别功能。

Pocket Vision AI Moondream2 16B参数 AI大模型 AI模型参数优化

2024-12-11 12:31:16 259人关注

京东发布10大AI营销工具，最高模型规模达810亿参数

在人工智能快速发展的今天，京东云正在用实际行动诠释技术创新的力量。近日，京东云发布了言犀智能营销平台，推出十大AI营销产品，为超80万商家提供智能化解决方案，展现了AI技术在产业落地中的巨大潜力。

京东AI营销工具 810B参数大模型 AI营销技术大模型参数优化 AI营销工具应用场景

- 上云资讯 -

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

美团发布 LongCat-Flash-Chat：560B 参数模型再创新高，智能体表现惊艳！

微软论文再曝OpenAI模型参数？医疗AI评测意外暴露4o-mini只有8B

全球首个亿级参数地震波大模型 “谛听” 发布，2025 年将全面开放

微软Q-Sparse模型：8B参数性能直逼7B模型训练微调轻松搞定！

震惊AI界！Llama 3.1泄露：4050亿参数的开源巨兽来袭！

智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T

小巧强大！口袋级视觉AI模型moondream2：仅有16亿参数，手机就能运行

京东发布10大AI营销工具，最高模型规模达810亿参数

推荐阅读

上云服务

- 上云资讯 -

​微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

美团发布 LongCat-Flash-Chat：560B 参数模型再创新高，智能体表现惊艳！

微软论文再曝OpenAI模型参数？医疗AI评测意外暴露4o-mini只有8B

全球首个亿级参数地震波大模型 “谛听” 发布，2025 年将全面开放

微软Q-Sparse模型：8B参数性能直逼7B模型 训练微调轻松搞定！

震惊AI界！Llama 3.1泄露：4050亿参数的开源巨兽来袭！

智源研究院开源全球首个万亿单体稠密模型Tele-FLM-1T

小巧强大！口袋级视觉AI模型moondream2：仅有16亿参数，手机就能运行

京东发布10大AI营销工具，最高模型规模达810亿参数

推荐阅读

上云服务

微软推出新型 AI Agent 模型 rStar2-Agent，以 140 亿参数挑战大规模模型

微软Q-Sparse模型：8B参数性能直逼7B模型训练微调轻松搞定！