上云资讯 - 来上云吧，企业上云一站式服务

2025-12-18 08:36:27 98人关注

AI 科学研究新基准:FrontierScience 评估模型推理能力

在科学研究中，推理能力至关重要。科学家们不仅仅是回忆事实，还需提出假设、测试并修正这些假设，并在不同领域之间综合思想。随着 AI 模型能力的提升，如何评估它们在科学研究中深度推理的能力成为了一个重要问题。

AI

2025-10-23 10:45:42 155人关注

应对模型推理缺陷:苹果MIND团队加紧招聘AI人才

在苹果公司最近发布一项引发广泛讨论的研究，揭示当前大型推理模型存在重大缺陷之后，该公司正迅速行动，加紧招聘该领域的高级人才。

AI

2025-10-16 09:42:32 218人关注

蚂蚁 dInfer 框架：扩散模型推理速度提升 10 倍，超越自回归模型

近日，蚂蚁集团开源了全新的 dInfer 框架，专门用于扩散大语言模型的高效推理。这一框架的推出标志着扩散模型在自然语言处理领域的应用取得了重大进展，推理速度提升至以往的10倍，并在同样模型性能下超越了传统的自回归模型。

AI

2025-10-14 09:37:24 167人关注

首次超越自回归模型！蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

10月13日，蚂蚁集团正式开源业界首个高性能扩散语言模型推理框架dInfer。

AI

2025-09-12 17:18:45 230人关注

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

蚂蚁集团和人民大学联合研发原生MoE架构扩散语言模型（dLLM） LLaDA-MoE，在约20T数据上完成了从零训练MoE架构的扩散语言模型，验证了工业级大规模训练的扩展性和稳定性;效果超过此前发布稠密扩散语言模型LLaDA1.0/1.5和Dream-7B，比肩等效自回归模型，并保有数倍的推理速度优势。模型将在近期完全开源，以推动全球AI社区在dLLM上的技术发展。

MoE架构扩散语言模型 LLaDA-MoE模型开源 dLLM技术发展工业级大规模训练扩散语言模型推理速度优势 AI社区技术推动

2025-09-10 18:42:43 723人关注

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

阿里巴巴通义千问团队刚刚向全球开发者抛出了一枚重磅炸弹，他们即将发布的Qwen3-Next-80B-A3B-Instruct模型彻底颠覆了传统大模型的运行逻辑。这个看似矛盾的数字组合背后，藏着一个令人惊叹的技术突破:总参数高达80亿，但实际激活的参数仅有3亿，就像一台超级跑车只用了十分之一的引擎却跑出了十倍的速度。

通义千问模型大模型推理优化稀疏激活技术高效AI计算 80亿参数模型 3亿激活参数模型性能提升

2025-09-04 13:22:41 421人关注

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

近日，Meta AI 联合加州大学圣地亚哥分校（UCSD）推出了一种名为 Deep Think with Confidence（DeepConf）的新技术，旨在帮助企业在大语言模型（LLM）的复杂推理任务中，有效降低算力成本的同时保持高准确率。

大语言模型推理优化 DeepConf 技术解析 LLM 算力成本降低复杂推理任务效率提升 Meta AI 与 UCSD 合作研究企业级 AI 应用优化

2025-08-19 11:17:38 190人关注

理想汽车MindGPT 3.1发布：速度跃升近5倍

理想汽车正式宣布其自研的MindGPT大模型迎来重大升级，全新版本MindGPT3.1惊艳亮相。此次升级将智能体能力深度融入大模型之中，实现了边想边搜的创新功能，即在推理过程中能够同步调用各类工具，从而为用户提供更加迅速、全面且精准的结果反馈。

理想汽车MindGPT3.1 自研大模型升级智能体能力融入大模型边想边搜功能大模型推理工具调用 AI大模型精准反馈

2025-08-13 08:14:26 225人关注

华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

8月12日，华为将在 2025金融AI推理应用落地与发展论坛上发布突破性 AI 推理创新技术 UCM（推理记忆数据管理器）。该技术有望降低中国 AI 推理对 HBM（高带宽内存）的依赖，并显著提升国内大模型推理性能。

华为AI推理技术金融AI推理应用 UCM技术发布 AI推理性能提升降低HBM依赖大模型推理优化

2025-08-09 10:29:23 303人关注

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

近日，开源机器学习框架 PyTorch 迎来了全新版本2.8的正式发布。这一版本的发布备受关注，主要集中在提升量化大语言模型（LLM）的推理性能，尤其是在 Intel CPU 上的表现。此次更新不仅显著增强了在离线模式下的推理效率，还首次实验性支持了 Intel GPU 的分布式后端。

PyTorch 2.8 新特性量化大语言模型推理性能提升 Intel CPU 推理优化离线模式推理效率 Intel GPU 分布式后端支持 PyTorch 量化 LLM 优化

2025-08-08 09:17:14 197人关注

消息称百度 8 月底前将发布新AI推理模型文心5.0未来数月推出

据报道，百度正在加速推进其文心大模型的更新计划。消息人士透露，百度最快将于8月底推出文心大模型的最新版推理模型，目前该模型正处于紧张的测试阶段。这一新版本在逻辑推理和复杂计算等关键能力上有望超越OpenAI的o3满血版。

百度文心大模型文心大模型更新计划文心大模型推理模型文心大模型逻辑推理能力文心大模型复杂计算能力文心大模型与OpenAI对比

2025-08-05 15:34:15 175人关注

小米全量开源MiDashengLM-7B：音频理解性能刷新SOTA，推理速度暴增20倍

小米今日正式发布并全量开源了MiDashengLM-7B多模态大模型，这款专注于音频理解的AI模型在性能和效率两个维度都实现了显著突破。该模型不仅在22个公开评测集上刷新了多模态大模型的最好成绩，更在推理效率上展现出惊人优势——单样本推理的首Token延迟仅为业界先进模型的四分之一，数据吞吐效率更是高出20倍以上。

小米多模态大模型 MiDashengLM-7B 音频理解AI模型大模型推理效率多模态大模型评测大模型数据吞吐效率

2025-08-05 13:40:23 240人关注

阿里巴巴与南开大学携手推出视频大模型新型压缩技术LLaVA-Scissor

近日，阿里巴巴通义实验室与南开大学计算机科学学院联合发布了一种创新的视频大模型压缩方法 ——LLaVA-Scissor。这一技术的出现旨在应对视频模型处理中的一系列挑战，特别是传统方法在处理视频帧时所面临的高 token 数量带来的推理速度和扩展性问题。

视频大模型压缩技术 LLaVA-Scissor 方法视频模型处理挑战视频帧 token 优化大模型推理速度提升

2025-08-04 16:13:27 271人关注

昆仑万维发布并开源全新推理大模型 MindLink

昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink，同时公布了72B模型权重、技术报告及代码仓库链接，引发行业广泛关注。

昆仑万维Skywork MindLink 大模型推理技术 72B模型权重开源大模型技术报告开源大模型代码仓库

2025-07-04 17:26:15 278人关注

揭开大模型的秘密！那些 “思考词” 背后藏着惊人的信息量

近日，来自中国人民大学、上海人工智能实验室、伦敦大学学院和大连理工大学的研究团队揭示了大模型推理过程中的一个重要发现:当模型在思考时，所使用的 “思考词” 实际上反映了其内部信息量的显著提升。这一研究成果通过信息论的方法，为我们更好地理解人工智能的推理机制提供了新的视角。

大模型推理机制 AI思考词研究信息论与AI推理大模型内部信息量人工智能推理新视角

2025-06-30 16:29:19 210人关注

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

近日，百度正式宣布开源其文心大模型4.5系列，共推出了十款模型，包括47B、3B 激活参数的混合专家（MoE）模型，以及0.3B 参数的稠密型模型。此次开源不仅实现了预训练权重的完整公开，还提供了推理代码，标志着百度在大模型领域的重大进展。

百度文心大模型4.5 文心大模型开源 MoE模型大模型预训练权重大模型推理代码百度大模型进展

2025-06-30 11:22:37 211人关注

华为开源盘古7B稠密和72B混合专家模型

6月30日，华为于正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE720亿参数的混合专家模型，以及基于升腾的模型推理技术。

华为盘古模型开源盘古70亿参数稠密模型盘古Pro MoE720亿参数模型升腾模型推理技术华为大模型开源

2025-06-24 08:32:28 359人关注

阿里云推出自动驾驶模型加速框架PAI-TurboX 训练时间可缩短50%

近日，阿里云正式发布面向自动驾驶领域模型的训练、推理加速框架——PAI-TurboX，旨在提升感知、规划控制乃至世界模型的训推效率。该框架在多个行业模型的训练任务中展现出了显著优势，可缩短高达50%的时间。

阿里云PAI-TurboX 自动驾驶模型训练加速自动驾驶模型推理加速 PAI-TurboX框架优势自动驾驶世界模型训练

2025-06-18 13:23:13 241人关注

大模型推理大变革！CMU 与英伟达携手推出 Multiverse，实现超高速并行生成

随着人工智能的发展，大型语言模型（LLM）的应用越来越广泛，但目前的推理方式仍然存在不少局限性。传统的自回归生成方式需要逐个生成 token，效率较低且无法充分利用现代硬件的并行计算能力。为了解决这一问题，卡耐基梅隆大学(CMU)与英伟达的研究团队推出了一种名为 Multiverse 的新型生成模型，旨在实现原生并行生成，从根本上改变我们对 LLM 推理的理解。

大型语言模型 LLM推理优化 Multiverse生成模型并行计算能力原生并行生成技术 LLM效率提升

2025-06-17 15:40:19 1752人关注

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

近日，豆包大模型迎来了全新1.6版本，标志着其综合能力的再次跃升。在推理、数学、指令遵循等多个核心领域，豆包1.6实现了显著的性能提升，同时大幅降低了用户使用的门槛，推动 AI Agent 在消费电子、汽车、金融等行业的快速应用。

豆包大模型1.6 大模型性能提升 AI Agent行业应用大模型推理能力大模型数学能力指令遵循优化

- 上云资讯 -

AI 科学研究新基准:FrontierScience 评估模型推理能力

应对模型推理缺陷:苹果MIND团队加紧招聘AI人才

蚂蚁 dInfer 框架：扩散模型推理速度提升 10 倍，超越自回归模型

首次超越自回归模型！蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

理想汽车MindGPT 3.1发布：速度跃升近5倍

华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

消息称百度 8 月底前将发布新AI推理模型文心5.0未来数月推出

小米全量开源MiDashengLM-7B：音频理解性能刷新SOTA，推理速度暴增20倍

阿里巴巴与南开大学携手推出视频大模型新型压缩技术LLaVA-Scissor

昆仑万维发布并开源全新推理大模型 MindLink

揭开大模型的秘密！那些 “思考词” 背后藏着惊人的信息量

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

华为开源盘古7B稠密和72B混合专家模型

阿里云推出自动驾驶模型加速框架PAI-TurboX 训练时间可缩短50%

大模型推理大变革！CMU 与英伟达携手推出 Multiverse，实现超高速并行生成

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

推荐阅读

上云服务

- 上云资讯 -

AI 科学研究新基准:FrontierScience 评估模型推理能力

应对模型推理缺陷:苹果MIND团队加紧招聘AI人才

蚂蚁 dInfer 框架：扩散模型推理速度提升 10 倍，超越自回归模型

首次超越自回归模型！蚂蚁集团开源业内首个高性能扩散语言模型推理框架dInfer

挑战主流认知！蚂蚁、人大在2025外滩大会发布行业首个原生MoE扩散语言模型

80亿参数只用3亿！阿里千问3新模型推理速度暴增10倍

Meta 推出 DeepConf 技术，智能平衡大型语言模型的推理成本与准确性

理想汽车MindGPT 3.1发布：速度跃升近5倍

华为推新技术优化大模型推理：UCM 技术缓解 HBM 依赖

PyTorch 2.8重磅发布：量化LLM推理性能飞跃，Intel GPU 支持来袭！

消息称百度 8 月底前将发布新AI推理模型 文心5.0未来数月推出

小米全量开源MiDashengLM-7B：音频理解性能刷新SOTA，推理速度暴增20倍

​阿里巴巴与南开大学携手推出视频大模型新型压缩技术LLaVA-Scissor

昆仑万维发布并开源全新推理大模型 MindLink

揭开大模型的秘密！那些 “思考词” 背后藏着惊人的信息量

百度重磅开源文心大模型 4.5 系列，国内大模型市场再掀波澜！

华为开源盘古7B稠密和72B混合专家模型

阿里云推出自动驾驶模型加速框架PAI-TurboX 训练时间可缩短50%

大模型推理大变革！CMU 与英伟达携手推出 Multiverse，实现超高速并行生成

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

推荐阅读

上云服务

消息称百度 8 月底前将发布新AI推理模型文心5.0未来数月推出

阿里巴巴与南开大学携手推出视频大模型新型压缩技术LLaVA-Scissor