上云资讯 - 来上云吧，企业上云一站式服务

AI对话上云服务上云资讯解决方案关于我们

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-04 16:13:27 314人关注

昆仑万维发布并开源全新推理大模型 MindLink

昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink，同时公布了72B模型权重、技术报告及代码仓库链接，引发行业广泛关注。

昆仑万维Skywork MindLink 大模型推理技术 72B模型权重开源大模型技术报告开源大模型代码仓库

2025-06-30 11:22:37 262人关注

华为开源盘古7B稠密和72B混合专家模型

6月30日，华为于正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE720亿参数的混合专家模型，以及基于升腾的模型推理技术。

华为盘古模型开源盘古70亿参数稠密模型盘古Pro MoE720亿参数模型升腾模型推理技术华为大模型开源

2025-05-31 16:28:40 225人关注

研究人员揭示大模型并非真正推理，只是在 “找关系”

随着人工智能（AI）技术的飞速发展，越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日，亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文，指出我们对这些 AI 模型的理解可能存在误区。他们认为，这些模型实际上并不会进行真正的思考或推理，而仅仅是在寻找相关性。

模型推理能力 AI模型推理研究模型推理技术 AI推理模型评估模型推理性能优化

2025-04-19 16:27:27 281人关注

金山云星流训推平台全面接入智谱GLM系列推理模型

金山云宣布其星流训推平台已全面接入智谱 GLM 系列推理模型，成为首批接入该系列推理模型的平台之一。这一举措标志着金山云在 AI 领域的进一步拓展，为用户提供更加高效、智能和更具性价比的模型服务。

金山云星流GLM GLM推理大模型推理技术金山云AI新闻星流GLM推理优化

2025-03-13 18:14:31 919人关注

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

近日，Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试，结果显示，DeepSeek-R1的幻觉率高达14.3%，显著高于其前身 DeepSeek-V3的3.9%。这表明，在增强推理的过程中，DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型（LLM）产生幻觉率的广泛讨论。

DeepSeek R1 大模型幻觉问题推理准确性提升 DeepSeek R1模型优化大模型推理技术

2025-03-06 10:18:18 1020人关注

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

阿里巴巴旗下的Qwen团队近日推出了其最新的开源大型语言模型（LLM）家族成员——QwQ-32B。这款拥有320亿参数的推理模型，旨在通过强化学习（RL）提升在复杂问题解决任务上的性能。

阿里开源模型 QWQ-32B 开源推理模型阿里大模型开源AI模型大模型推理技术

2025-01-28 10:37:18 566人关注

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

2025年1月20日，DeepSeek 宣布推出其首个通过强化学习（RL）训练的推理模型 DeepSeek-R1，该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型，并采用了多阶段训练和冷启动数据来提高推理能力。

DeepSeek R1 DeepSeek 推理模型 OpenAI O1 大模型推理技术 DeepSeek 新模型发布 AI 推理模型对比

2025-01-06 04:41:35 406人关注

谷歌DeepMind新方法GenRM 一举提升AI推理能力，准确率飙升

最近，谷歌 DeepMind 的研究团队联合多所高校提出了一种新方法，名为生成奖励模型（GenRM），旨在提升生成式 AI 在推理任务中的准确性和可靠性。

Google DeepMind GenRM AI AI reasoning AI大模型推理技术 DeepMind最新AI研究

2024-12-27 08:37:45 232人关注

像人脑一样思考！Meta 新模型Dualformer融合快慢思维，推理能力大幅提升

Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型，该模型模仿人类的双重认知系统，能够无缝整合快速和慢速推理模式，在推理能力和计算效率上取得了显著突破。

Meta DualFormer 推理能力增强 AI大模型优化模型推理技术 AI技术进展 Meta DualFormer应用场景

- 上云资讯 -

昆仑万维发布并开源全新推理大模型 MindLink

华为开源盘古7B稠密和72B混合专家模型

研究人员揭示大模型并非真正推理，只是在 “找关系”

金山云星流训推平台全面接入智谱GLM系列推理模型

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

谷歌DeepMind新方法GenRM 一举提升AI推理能力，准确率飙升

像人脑一样思考！Meta 新模型Dualformer融合快慢思维，推理能力大幅提升

推荐阅读

上云服务

- 上云资讯 -

昆仑万维发布并开源全新推理大模型 MindLink

华为开源盘古7B稠密和72B混合专家模型

研究人员揭示大模型并非真正推理，只是在 “找关系”

金山云星流训推平台全面接入智谱GLM系列推理模型

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

​阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

谷歌DeepMind新方法GenRM 一举提升AI推理能力，准确率飙升

像人脑一样思考！Meta 新模型Dualformer融合快慢思维，推理能力大幅提升

推荐阅读

上云服务

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小