- 上云资讯 -
2025-12-13 09:18:29 72人关注
蚂蚁开源 LLaDA2.0,业内首个100B 参数规模的扩散语言模型
在大语言模型技术发展的新潮流中,蚂蚁技术研究院于近日正式发布了 LLaDA2.0系列,这是业内首个参数规模达到100B 的离散扩散大语言模型(dLLM)。这一创新的模型不仅打破了扩散模型难以规模化的固有印象,还在生成质量和推理速度上实现了显著的提升,为大语言模型领域开辟了新的发展方向。
2025-12-12 15:21:19 19人关注
Starcloud 在太空中成功训练大型语言模型
NVIDIA 支持的初创公司 Starcloud 最近在太空中首次成功训练了大型语言模型(LLM),标志着向太空数据中心迈出了重要一步。随着对计算能力和能源需求的增加,利用太空资源成为未来的发展方向。
2025-12-11 15:25:12 43人关注
阿里通义推出新型强化学习方法 SAPO,让大语言模型更稳更强
在大语言模型(LLM)发展的浪潮中,阿里通义 Qwen 团队近日推出了一种创新的强化学习方法 ——Soft Adaptive Policy Optimization(SAPO)。这一方法的核心目标是解决当前大语言模型在强化学习中面临的策略优化不稳定性问题。
2025-12-10 08:15:10 41人关注
MIT 推出新方法,显著提升大型语言模型计算效率
MIT 的研究团队近日发布了一项创新的计算方法,旨在提高大型语言模型(LLM)的运算效率,同时降低能源消耗。这项名为实例自适应缩放的技术,可以根据提问的复杂程度调整计算资源。研究小组的相关论文于11月初发布,得到了 MIT-IBM 沃森人工智能实验室、MIT-Amazon 科学中心、MIT-Google 计算创新项目以及 MathWorks 的支持。
2025-12-07 09:44:11 33人关注
StepFun AI 发布全新音频大语言模型 Step-Audio-R1,音频推理能力显著提升
StepFun AI 团队近日推出了新的音频大语言模型 Step-Audio-R1,该模型在生成推理时可以有效利用计算资源,解决了当前音频 AI 模型在处理长推理链时准确性下降的问题。研究团队指出,这一问题并非音频模型固有的局限,而是由于训练过程中采用了文本替代推理的方式。
2025-12-05 13:38:15 45人关注
沙特 AI 初创公司发布首个阿拉伯语大语言模型 Kawn
近日,沙特阿拉伯的 AI 实验室 Misraj AI 在 AWS re:Invent 大会上推出了其全新的阿拉伯语大语言模型 Kawn。该模型旨在促进各行业的阿拉伯语交流,提供多种模型和服务,以支持阿拉伯语的应用。
2025-11-17 11:13:18 122人关注
AI 也会 “脑损伤”?研究揭示低质量数据对大语言模型的影响
最近,一项引人关注的研究表明,大语言模型(LLM)在持续接触低质量数据后,会出现类似于人类的 “脑损伤” 现象,导致推理和记忆能力显著下降。研究者发现,AI 模型在接受高流行但低价值的社交媒体数据(如 Twitter)训练后,推理能力下降了23%,长上下文记忆能力下降了30%。而更令人担忧的是,这种损伤是不可逆的,即使在后续用高质量数据进行训练,模型也无法完全恢复到初始状态。
2025-11-16 14:35:36 54人关注
Inception重启!获5000万美元融资推出新一代扩散语言模型Mercury
人工智能初创公司 Inception 宣布重获新生,并完成 5000万美元新融资,由 Menlo Ventures 领投,微软旗下 M12基金、英伟达、Databricks 和 Snowflake 等共同参投。值得注意的是,该公司创始人、DeepMind 联合创始人 Mustafa Suleyman 曾于2024年将 Inception 出售给微软,如今公司再度复活。
2025-11-13 13:25:32 145人关注
微博推出 VibeThinker-1.5B,低成本 AI 模型挑战大型语言模型
近日,中国社交媒体公司微博的人工智能部门推出了开源的 VibeThinker-1.5B,这是一个拥有15亿参数的大型语言模型(LLM)。该模型是基于阿里巴巴的 Qwen2.5-Math-1.5B 进行的精细调整,现已在 Hugging Face、GitHub 和 ModelScope 上免费提供,供研究人员和企业开发者使用,甚至可用于商业目的,遵循 MIT 许可证。
2025-11-08 13:25:36 168人关注
美团LongCat发布创新基准测试UNO-Bench,全面提升多模态大语言模型评估能力
近日,美团 LongCat 团队推出了一个名为 UNO-Bench 的全新基准测试,旨在系统性地评估这些模型在不同模态下的理解能力。这个基准测试涵盖了44种任务类型和5种模态组合,力求全面展现模型的单模态与全模态的性能。
2025-11-04 18:20:42 59人关注
Grab 自研语言模型解决亚洲语言识别难题
新加坡超级应用程序公司 Grab 近日在其工程博客上分享了其自研语言模型的开发经历,指出现有的大型语言模型在理解东南亚语言时表现不佳。Grab 的超级应用程序提供打车、外卖、购物和金融服务等功能,覆盖新加坡、马来西亚、印尼、菲律宾、越南、泰国、柬埔寨和缅甸等国家,这些地区的文档通常使用非拉丁字母的脚本。
2025-10-21 16:15:38 190人关注
Andrej Karpathy评DeepSeek-OCR论文:图像输入可能成为大语言模型新方向
特斯拉前自动驾驶负责人、OpenAI联合创始人Andrej Karpathy近日在推特上评论了开源的DeepSeek-OCR论文,提出了一个颇具启发性的观点:相比传统文本输入,图像作为大语言模型(LLM)的输入形式可能更加高效。这一观点在AI研究社区引发了关于模型输入方式未来演进方向的讨论。
2025-10-19 10:26:30 188人关注
蚂蚁集团重磅推出 dInfer:让扩散语言模型的推理速度飙升 10 倍!
近日,蚂蚁集团正式开源了业内首个高性能扩散语言模型推理框架 ——dInfer。这一框架的推出,不仅意味着扩散语言模型在推理速度上取得了重大突破,也标志着这一新兴技术向实际应用迈出了重要一步。
2025-10-14 09:37:24 99人关注
首次超越自回归模型!蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer
10月13日,蚂蚁集团正式开源业界首个高性能扩散语言模型推理框架dInfer。
2025-10-13 09:40:41 300人关注
AI日报:Veo 3.1可生成1分钟视频;蚂蚁发布万亿参数语言模型 Ling-1T;Lovart可免费玩Sora2
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
2025-10-13 09:20:15 274人关注
蚂蚁发布万亿参数语言模型 Ling-1T,推理速度与能力引领行业新标杆
近日,蚂蚁集团正式推出其首款旗舰语言模型 ——Ling-1T,参数数量高达一万亿,成为国产开源模型中的一大亮点。Ling-1T 不仅在各类推理任务中表现出色,还在代码生成、数学计算和逻辑推理等多个领域树立了新的标杆。
2025-10-12 09:42:21 88人关注
AI安全警报:只需250份文件即可 “投毒” 大语言模型
近日,人工智能研究公司 Anthropic 发布了一项震惊业界的研究,揭示了对大语言模型进行 “数据投毒” 攻击的新可能性。以往,大家普遍认为,攻击者需要占训练数据中一定比例的 “毒药” 样本才能成功,但该研究颠覆了这一观念。实际上,只需 250 份 “投毒” 文档就足以对任何规模的大模型实施攻击。
2025-10-06 16:34:31 136人关注
Anthropic 语言模型成网络安全新锐力量:Claude4.5漏洞发现能力实现飞跃
Anthropic 公司正在力推其大型语言模型(LLM)在网络安全领域的巨大潜力,并以实战数据证明了 AI 在发现软件漏洞方面的快速进步。公司引用 CyberGym 排行榜的结果,表明其最新的模型在提高网络防御效率方面迈出了关键一步。
2025-09-27 14:33:30 109人关注
LeCun 新提案:用CV思路重塑语言模型,性能大幅提升!
在当今的人工智能领域,Yann LeCun 提出的 JEPA(联合嵌入预测架构)正在重新定义大语言模型(LLM)的训练方式。这位诺贝尔奖得主不是在批评现有的 LLM,而是亲自出手进行改造。传统的 LLM 训练方法主要依赖于输入空间中的重构与生成,如预测下一个单词,这种方法在视觉领域已被证明存在局限性。
2025-09-20 18:14:29 140人关注
解锁 LLM Agent 力量!Anthropic 发布工具编写指南,助你玩转大语言模型!
近日,人工智能公司 Anthropic 在其官方博客上发布了一份重磅指南《Writing effective tools for LLM agents—using LLM agents》。这份指南详细阐述了如何利用 Model Context Protocol(MCP)为大语言模型(LLM)代理(Agent)设计高效工具,提供了一个系统化的 “原型 - 评估 - 协作” 三步迭代流程,旨在帮助开发者更好地构建和优化工具。
