- 上云资讯 -
2025-06-30 11:22:37 47人关注
华为开源盘古7B稠密和72B混合专家模型
6月30日,华为于正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE720亿参数的混合专家模型,以及基于升腾的模型推理技术。
2025-03-13 18:14:31 417人关注
DeepSeek-R1 模型幻觉问题严重,推理能力与准确性面临挑战
近日,Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试,结果显示,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身 DeepSeek-V3的3.9%。这表明,在增强推理的过程中,DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型(LLM)产生幻觉率的广泛讨论。
2025-01-28 10:37:18 347人关注
DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1
2025年1月20日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采用了多阶段训练和冷启动数据来提高推理能力。
DeepSeek R1 DeepSeek 推理模型 OpenAI O1 大模型推理技术 DeepSeek 新模型发布 AI 推理模型对比
2025-01-06 04:41:35 207人关注
谷歌DeepMind新方法GenRM 一举提升AI推理能力,准确率飙升
最近,谷歌 DeepMind 的研究团队联合多所高校提出了一种新方法,名为生成奖励模型(GenRM),旨在提升生成式 AI 在推理任务中的准确性和可靠性。
Google DeepMind GenRM AI AI reasoning AI大模型推理技术 DeepMind最新AI研究
2024-12-27 08:37:45 100人关注
像人脑一样思考!Meta 新模型Dualformer融合快慢思维,推理能力大幅提升
Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型,该模型模仿人类的双重认知系统,能够无缝整合快速和慢速推理模式,在推理能力和计算效率上取得了显著突破。
Meta DualFormer 推理能力增强 AI大模型优化 模型推理技术 AI技术进展 Meta DualFormer应用场景