LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-04-19 16:27:27 99人关注

金山云星流训推平台全面接入智谱GLM系列推理模型

金山云宣布其星流训推平台已全面接入智谱 GLM 系列推理模型,成为首批接入该系列推理模型的平台之一。这一举措标志着金山云在 AI 领域的进一步拓展,为用户提供更加高效、智能和更具性价比的模型服务。

金山云 星流GLM GLM推理 大模型推理技术 金山云AI新闻 星流GLM推理优化

2025-03-13 18:14:31 417人关注

DeepSeek-R1 模型幻觉问题严重,推理能力与准确性面临挑战

近日,Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试,结果显示,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身 DeepSeek-V3的3.9%。这表明,在增强推理的过程中,DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型(LLM)产生幻觉率的广泛讨论。

DeepSeek R1 大模型幻觉问题 推理准确性提升 DeepSeek R1模型优化 大模型推理技术

2025-03-06 10:18:18 555人关注

​阿里新开源推理大模型QwQ-32B,性能媲美DeepSeek-R1、显存需求更小

阿里巴巴旗下的Qwen团队近日推出了其最新的开源大型语言模型(LLM)家族成员——QwQ-32B。这款拥有320亿参数的推理模型,旨在通过强化学习(RL)提升在复杂问题解决任务上的性能。

阿里开源模型 QWQ-32B 开源推理模型 阿里大模型 开源AI模型 大模型推理技术

2025-01-28 10:37:18 347人关注

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

2025年1月20日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采用了多阶段训练和冷启动数据来提高推理能力。

DeepSeek R1 DeepSeek 推理模型 OpenAI O1 大模型推理技术 DeepSeek 新模型发布 AI 推理模型对比

2025-01-06 04:41:35 207人关注

谷歌DeepMind新方法GenRM 一举提升AI推理能力,准确率飙升

最近,谷歌 DeepMind 的研究团队联合多所高校提出了一种新方法,名为生成奖励模型(GenRM),旨在提升生成式 AI 在推理任务中的准确性和可靠性。

Google DeepMind GenRM AI AI reasoning AI大模型推理技术 DeepMind最新AI研究

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10