上云资讯 - 来上云吧，企业上云一站式服务

2025-12-11 15:25:12 246人关注

阿里通义推出新型强化学习方法 SAPO，让大语言模型更稳更强

在大语言模型（LLM）发展的浪潮中，阿里通义 Qwen 团队近日推出了一种创新的强化学习方法 ——Soft Adaptive Policy Optimization(SAPO)。这一方法的核心目标是解决当前大语言模型在强化学习中面临的策略优化不稳定性问题。

AI

2025-12-07 09:44:11 173人关注

StepFun AI 发布全新音频大语言模型 Step-Audio-R1，音频推理能力显著提升

StepFun AI 团队近日推出了新的音频大语言模型 Step-Audio-R1，该模型在生成推理时可以有效利用计算资源，解决了当前音频 AI 模型在处理长推理链时准确性下降的问题。研究团队指出，这一问题并非音频模型固有的局限，而是由于训练过程中采用了文本替代推理的方式。

AI

2025-12-05 13:38:15 159人关注

沙特 AI 初创公司发布首个阿拉伯语大语言模型 Kawn

近日，沙特阿拉伯的 AI 实验室 Misraj AI 在 AWS re:Invent 大会上推出了其全新的阿拉伯语大语言模型 Kawn。该模型旨在促进各行业的阿拉伯语交流，提供多种模型和服务，以支持阿拉伯语的应用。

AI

2025-11-17 11:13:18 261人关注

AI 也会 “脑损伤”？研究揭示低质量数据对大语言模型的影响

最近，一项引人关注的研究表明，大语言模型（LLM）在持续接触低质量数据后，会出现类似于人类的 “脑损伤” 现象，导致推理和记忆能力显著下降。研究者发现，AI 模型在接受高流行但低价值的社交媒体数据(如 Twitter)训练后，推理能力下降了23%，长上下文记忆能力下降了30%。而更令人担忧的是，这种损伤是不可逆的，即使在后续用高质量数据进行训练，模型也无法完全恢复到初始状态。

AI

2025-11-08 13:25:36 290人关注

美团LongCat发布创新基准测试UNO-Bench，全面提升多模态大语言模型评估能力

近日，美团 LongCat 团队推出了一个名为 UNO-Bench 的全新基准测试，旨在系统性地评估这些模型在不同模态下的理解能力。这个基准测试涵盖了44种任务类型和5种模态组合，力求全面展现模型的单模态与全模态的性能。

AI

2025-10-21 16:15:38 355人关注

Andrej Karpathy评DeepSeek-OCR论文：图像输入可能成为大语言模型新方向

特斯拉前自动驾驶负责人、OpenAI联合创始人Andrej Karpathy近日在推特上评论了开源的DeepSeek-OCR论文，提出了一个颇具启发性的观点:相比传统文本输入，图像作为大语言模型（LLM）的输入形式可能更加高效。这一观点在AI研究社区引发了关于模型输入方式未来演进方向的讨论。

AI

2025-10-12 09:42:21 189人关注

AI安全警报：只需250份文件即可 “投毒” 大语言模型

近日，人工智能研究公司 Anthropic 发布了一项震惊业界的研究，揭示了对大语言模型进行 “数据投毒” 攻击的新可能性。以往，大家普遍认为，攻击者需要占训练数据中一定比例的 “毒药” 样本才能成功，但该研究颠覆了这一观念。实际上，只需 250 份 “投毒” 文档就足以对任何规模的大模型实施攻击。

AI

2025-09-20 18:14:29 256人关注

解锁 LLM Agent 力量！Anthropic 发布工具编写指南，助你玩转大语言模型！

近日，人工智能公司 Anthropic 在其官方博客上发布了一份重磅指南《Writing effective tools for LLM agents—using LLM agents》。这份指南详细阐述了如何利用 Model Context Protocol（MCP）为大语言模型（LLM）代理（Agent）设计高效工具，提供了一个系统化的 “原型 - 评估 - 协作” 三步迭代流程，旨在帮助开发者更好地构建和优化工具。

AI

2025-09-11 18:34:14 592人关注

腾讯开源图检索增强生成框架Youtu-GraphRAG

9月11日，腾讯优图实验室开源了Youtu-GraphRAG，这是一个全新的图检索增强生成框架，旨在通过大语言模型+RAG模式，将知识组织成图谱，再交给大语言模型进行检索和推理，从而提高模型在处理复杂问答任务时的准确性和可追溯性。Youtu-GraphRAG特别适用于企业知识库问答、科研文档解析、个人知识管理等知识密集型场景。

腾讯优图实验室 Youtu-GraphRAG开源图检索增强生成框架大语言模型+RAG模式知识图谱组织企业知识库问答科研文档解析个人知识管理

2025-09-11 16:21:41 194人关注

张宏江外滩大会分享：基础设施加速扩张，AI 正步入“产业规模化”

9月11日，在2025Inclusion·外滩大会开幕主论坛上，源码资本投资合伙人、美国国家工程院外籍院士张宏江分享了他对于大语言模型、AI 智能体和智能体经济的思考。他表示，大模型的“规模定律（Scaling Law）”仍然有效，而智能体与经济结构转型将深刻重塑社会。

张宏江外滩大会演讲大语言模型规模定律 AI智能体经济转型源码资本张宏江观点智能体重塑社会结构

2025-09-09 08:22:11 300人关注

英伟达重磅推出通用深度研究系统：定制化智能研究新纪元！

英伟达最新发布的通用深度研究（UDR）系统，正引发科技界的广泛关注。这一系统不仅可以与任何大语言模型(LLM)兼容，更为用户提供了高度定制的深度研究策略，彻底改变了以往研究智能体的工作方式。

英伟达UDR系统通用深度研究系统大语言模型兼容深度研究策略定制研究智能体革新

2025-09-08 17:39:27 240人关注

Tilde AI 发布开源 TildeOpen LLM：支持多种欧洲语言的超大语言模型

Latvian 语言技术公司 Tilde 于2025年9月3日发布了 TildeOpen LLM，这是一个开源的基础大语言模型（LLM），旨在支持欧洲语言，特别是那些较少被代表的国家和地区语言。这一举措标志着欧盟在语言公平和数字主权方面迈出了重要的一步。

TildeOpen LLM 开源大语言模型欧洲语言支持语言公平数字主权欧盟语言技术

2025-09-05 13:13:19 656人关注

瑞士重磅发布自主开源AI大模型Apertus

在全球人工智能技术蓬勃发展的背景下，瑞士于近日正式推出了其首个完全开源的大语言模型 ——Apertus。这一模型由瑞士联邦理工学院（EPFL）、苏黎世联邦理工学院(ETH Zurich)以及国家超级计算中心(CSCS)共同研发，标志着瑞士在人工智能领域的自主创新迈出了重要一步。

瑞士Apertus大语言模型开源AI模型瑞士人工智能创新 EPFL人工智能研究 ETH Zurich语言模型 CSCS超级计算瑞士自主AI技术

2025-09-04 13:22:41 483人关注

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

近日，Meta AI 联合加州大学圣地亚哥分校（UCSD）推出了一种名为 Deep Think with Confidence（DeepConf）的新技术，旨在帮助企业在大语言模型（LLM）的复杂推理任务中，有效降低算力成本的同时保持高准确率。

大语言模型推理优化 DeepConf 技术解析 LLM 算力成本降低复杂推理任务效率提升 Meta AI 与 UCSD 合作研究企业级 AI 应用优化

2025-09-02 15:39:32 733人关注

开源多模态模型MiniCPM-V 4.5发布，8亿参数实现移动端AI部署

近日，开源AI社区迎来重要进展，面向端侧设备的多模态大语言模型MiniCPM-V4.5正式发布。这款模型以8亿参数规模实现了在智能手机和平板电脑上的高效运行，为移动端AI应用开拓了新的可能性。

MiniCPM-V4.5 端侧多模态大语言模型移动端AI应用 8亿参数模型智能手机AI运行平板电脑AI应用

2025-09-01 13:28:17 377人关注

腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频

近日，腾讯 ARC 团队发布了一款名为 AudioStory 的模型，旨在利用大语言模型（LLMs）生成长篇叙事音频。该模型解决了现有文本到音频生成技术在处理短音频方面的优势与长篇叙事音频在时间连贯性与组合推理上的挑战。

腾讯ARC团队AudioStory模型大语言模型生成长篇音频文本到音频生成技术长篇叙事音频时间连贯性音频生成组合推理挑战

2025-09-01 12:23:20 598人关注

美团推出开源大模型LongCat:旨在赋能开发者，加速AI应用落地

近日，美团正式发布其最新的开源大语言模型 LongCat（龙猫），旨在推动人工智能技术的发展和应用。该模型的发布不仅标志着美团在AI领域的又一重要进展，也为开发者和研究人员提供了一个功能强大的新工具。

美团LongCat开源模型美团大语言模型龙猫AI模型美团AI技术进展开源大模型工具

2025-08-22 14:38:16 415人关注

字节跳动王炸出击：Seed-OSS-36B开源模型横空出世，512K超长上下文碾压DeepSeek引爆AI圈

AI大模型的军备竞赛再次升级，这一次轮到字节跳动投下震撼弹。这家以抖音和今日头条闻名的科技巨头正式宣布开源其最新力作Seed-OSS-36B大语言模型，凭借360亿参数规模和原生512K超长上下文窗口的惊人配置，瞬间成为开源AI社区的焦点，让整个行业为之侧目。

字节跳动开源大模型 Seed-OSS-36B 360亿参数大模型 512K上下文窗口开源AI社区焦点大语言模型军备竞赛

2025-08-22 08:18:25 432人关注

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

AI技术趋势 AI开发者指南 AI创新应用人工智能热点 AI产品洞悉

2025-08-21 09:14:30 219人关注

浙大团队破解AI生成难题：让机器学会"深思熟虑"而非"冲动决策"

人工智能正在经历一场静悄悄的革命。当我们还在惊叹ChatGPT一个字一个字蹦出答案的神奇时，一种全新的AI思维模式正在悄然崛起——扩散大语言模型就像一个会反复思考的智者，不再急于给出答案，而是在多个时间维度中反复琢磨，最终呈现出更加精准的结果。

扩散大语言模型 AI思维模式多时间维度思考 AI精准推理 AI技术演进扩散模型与ChatGPT对比

- 上云资讯 -

阿里通义推出新型强化学习方法 SAPO，让大语言模型更稳更强

StepFun AI 发布全新音频大语言模型 Step-Audio-R1，音频推理能力显著提升

沙特 AI 初创公司发布首个阿拉伯语大语言模型 Kawn

AI 也会 “脑损伤”？研究揭示低质量数据对大语言模型的影响

美团LongCat发布创新基准测试UNO-Bench，全面提升多模态大语言模型评估能力

Andrej Karpathy评DeepSeek-OCR论文：图像输入可能成为大语言模型新方向

AI安全警报：只需250份文件即可 “投毒” 大语言模型

解锁 LLM Agent 力量！Anthropic 发布工具编写指南，助你玩转大语言模型！

腾讯开源图检索增强生成框架Youtu-GraphRAG

张宏江外滩大会分享：基础设施加速扩张，AI 正步入“产业规模化”

英伟达重磅推出通用深度研究系统：定制化智能研究新纪元！

Tilde AI 发布开源 TildeOpen LLM：支持多种欧洲语言的超大语言模型

瑞士重磅发布自主开源AI大模型Apertus

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

开源多模态模型MiniCPM-V 4.5发布，8亿参数实现移动端AI部署

腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频

美团推出开源大模型LongCat:旨在赋能开发者，加速AI应用落地

字节跳动王炸出击：Seed-OSS-36B开源模型横空出世，512K超长上下文碾压DeepSeek引爆AI圈

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

浙大团队破解AI生成难题：让机器学会"深思熟虑"而非"冲动决策"

推荐阅读

上云服务

- 上云资讯 -

阿里通义推出新型强化学习方法 SAPO，让大语言模型更稳更强

​StepFun AI 发布全新音频大语言模型 Step-Audio-R1，音频推理能力显著提升

沙特 AI 初创公司发布首个阿拉伯语大语言模型 Kawn

AI 也会 “脑损伤”？研究揭示低质量数据对大语言模型的影响

美团LongCat发布创新基准测试UNO-Bench，全面提升多模态大语言模型评估能力

Andrej Karpathy评DeepSeek-OCR论文：图像输入可能成为大语言模型新方向

AI安全警报：只需250份文件即可 “投毒” 大语言模型

解锁 LLM Agent 力量！Anthropic 发布工具编写指南，助你玩转大语言模型！

腾讯开源图检索增强生成框架Youtu-GraphRAG

张宏江外滩大会分享：基础设施加速扩张，AI 正步入“产业规模化”

英伟达重磅推出通用深度研究系统：定制化智能研究新纪元！

Tilde AI 发布开源 TildeOpen LLM：支持多种欧洲语言的超大语言模型

瑞士重磅发布自主开源AI大模型Apertus

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

开源多模态模型MiniCPM-V 4.5发布，8亿参数实现移动端AI部署

​腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频

美团推出开源大模型LongCat:旨在赋能开发者，加速AI应用落地

字节跳动王炸出击：Seed-OSS-36B开源模型横空出世，512K超长上下文碾压DeepSeek引爆AI圈

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发布开源大语言模型 Seed-OSS

浙大团队破解AI生成难题：让机器学会"深思熟虑"而非"冲动决策"

推荐阅读

上云服务

StepFun AI 发布全新音频大语言模型 Step-Audio-R1，音频推理能力显著提升

腾讯ARC开源音频模型 AudioStory：用大语言模型生成长音频