上云资讯 - 来上云吧，企业上云一站式服务

AI对话上云服务上云资讯解决方案关于我们

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-08-04 16:13:27 314人关注

昆仑万维发布并开源全新推理大模型 MindLink

昆仑万维正式发布并开源了其最新推理大模型Skywork MindLink，同时公布了72B模型权重、技术报告及代码仓库链接，引发行业广泛关注。

昆仑万维Skywork MindLink 大模型推理技术 72B模型权重开源大模型技术报告开源大模型代码仓库

2025-04-19 16:27:27 280人关注

金山云星流训推平台全面接入智谱GLM系列推理模型

金山云宣布其星流训推平台已全面接入智谱 GLM 系列推理模型，成为首批接入该系列推理模型的平台之一。这一举措标志着金山云在 AI 领域的进一步拓展，为用户提供更加高效、智能和更具性价比的模型服务。

金山云星流GLM GLM推理大模型推理技术金山云AI新闻星流GLM推理优化

2025-03-13 18:14:31 919人关注

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

近日，Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试，结果显示，DeepSeek-R1的幻觉率高达14.3%，显著高于其前身 DeepSeek-V3的3.9%。这表明，在增强推理的过程中，DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型（LLM）产生幻觉率的广泛讨论。

DeepSeek R1 大模型幻觉问题推理准确性提升 DeepSeek R1模型优化大模型推理技术

2025-03-06 10:18:18 1019人关注

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

阿里巴巴旗下的Qwen团队近日推出了其最新的开源大型语言模型（LLM）家族成员——QwQ-32B。这款拥有320亿参数的推理模型，旨在通过强化学习（RL）提升在复杂问题解决任务上的性能。

阿里开源模型 QWQ-32B 开源推理模型阿里大模型开源AI模型大模型推理技术

2025-01-28 10:37:18 566人关注

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

2025年1月20日，DeepSeek 宣布推出其首个通过强化学习（RL）训练的推理模型 DeepSeek-R1，该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型，并采用了多阶段训练和冷启动数据来提高推理能力。

DeepSeek R1 DeepSeek 推理模型 OpenAI O1 大模型推理技术 DeepSeek 新模型发布 AI 推理模型对比

2025-01-06 04:41:35 404人关注

谷歌DeepMind新方法GenRM 一举提升AI推理能力，准确率飙升

最近，谷歌 DeepMind 的研究团队联合多所高校提出了一种新方法，名为生成奖励模型（GenRM），旨在提升生成式 AI 在推理任务中的准确性和可靠性。

Google DeepMind GenRM AI AI reasoning AI大模型推理技术 DeepMind最新AI研究

- 上云资讯 -

昆仑万维发布并开源全新推理大模型 MindLink

金山云星流训推平台全面接入智谱GLM系列推理模型

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

谷歌DeepMind新方法GenRM 一举提升AI推理能力，准确率飙升

推荐阅读

上云服务

- 上云资讯 -

昆仑万维发布并开源全新推理大模型 MindLink

金山云星流训推平台全面接入智谱GLM系列推理模型

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

​阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

谷歌DeepMind新方法GenRM 一举提升AI推理能力，准确率飙升

推荐阅读

上云服务

阿里新开源推理大模型QwQ-32B，性能媲美DeepSeek-R1、显存需求更小