LetsClouds-Logo
AI对话 上云服务 上云资讯 解决方案 关于我们
售前咨询 021-50583875
微信二维码

微信扫码

添加专属顾问

- 上云资讯 -

阿里云云原生 阿里云开发者 腾讯云开发者 火山引擎开发者社区 魔搭ModelScope社区 微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-06-30 11:22:37 47人关注

华为开源盘古7B稠密和72B混合专家模型

6月30日,华为于正式宣布开源盘古70亿参数的稠密模型、盘古Pro MoE720亿参数的混合专家模型,以及基于升腾的模型推理技术。

华为盘古模型开源 盘古70亿参数稠密模型 盘古Pro MoE720亿参数模型 升腾模型推理技术 华为大模型开源

2025-05-31 16:28:40 65人关注

研究人员揭示大模型并非真正推理,只是在 “找关系”

随着人工智能(AI)技术的飞速发展,越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日,亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文,指出我们对这些 AI 模型的理解可能存在误区。他们认为,这些模型实际上并不会进行真正的思考或推理,而仅仅是在寻找相关性。

模型推理能力 AI模型推理研究 模型推理技术 AI推理模型评估 模型推理性能优化

2025-04-19 16:27:27 99人关注

金山云星流训推平台全面接入智谱GLM系列推理模型

金山云宣布其星流训推平台已全面接入智谱 GLM 系列推理模型,成为首批接入该系列推理模型的平台之一。这一举措标志着金山云在 AI 领域的进一步拓展,为用户提供更加高效、智能和更具性价比的模型服务。

金山云 星流GLM GLM推理 大模型推理技术 金山云AI新闻 星流GLM推理优化

2025-03-13 18:14:31 417人关注

DeepSeek-R1 模型幻觉问题严重,推理能力与准确性面临挑战

近日,Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试,结果显示,DeepSeek-R1的幻觉率高达14.3%,显著高于其前身 DeepSeek-V3的3.9%。这表明,在增强推理的过程中,DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型(LLM)产生幻觉率的广泛讨论。

DeepSeek R1 大模型幻觉问题 推理准确性提升 DeepSeek R1模型优化 大模型推理技术

2025-03-06 10:18:18 555人关注

​阿里新开源推理大模型QwQ-32B,性能媲美DeepSeek-R1、显存需求更小

阿里巴巴旗下的Qwen团队近日推出了其最新的开源大型语言模型(LLM)家族成员——QwQ-32B。这款拥有320亿参数的推理模型,旨在通过强化学习(RL)提升在复杂问题解决任务上的性能。

阿里开源模型 QWQ-32B 开源推理模型 阿里大模型 开源AI模型 大模型推理技术

2025-01-28 10:37:18 347人关注

DeepSeek推出全新推理模型 DeepSeek-R1 性能比肩OpenAI-o1

2025年1月20日,DeepSeek 宣布推出其首个通过强化学习 (RL) 训练的推理模型 DeepSeek-R1,该模型在多个推理基准测试中取得了与 OpenAI-o1-1217相当的性能。 DeepSeek-R1基于 DeepSeek-V3-Base 模型,并采用了多阶段训练和冷启动数据来提高推理能力。

DeepSeek R1 DeepSeek 推理模型 OpenAI O1 大模型推理技术 DeepSeek 新模型发布 AI 推理模型对比

2025-01-06 04:41:35 207人关注

谷歌DeepMind新方法GenRM 一举提升AI推理能力,准确率飙升

最近,谷歌 DeepMind 的研究团队联合多所高校提出了一种新方法,名为生成奖励模型(GenRM),旨在提升生成式 AI 在推理任务中的准确性和可靠性。

Google DeepMind GenRM AI AI reasoning AI大模型推理技术 DeepMind最新AI研究

2024-12-27 08:37:45 100人关注

像人脑一样思考!Meta 新模型Dualformer融合快慢思维,推理能力大幅提升

Meta 的 FAIR 团队最近推出了一款名为 Dualformer 的全新 Transformer 模型,该模型模仿人类的双重认知系统,能够无缝整合快速和慢速推理模式,在推理能力和计算效率上取得了显著突破。

Meta DualFormer 推理能力增强 AI大模型优化 模型推理技术 AI技术进展 Meta DualFormer应用场景

推荐阅读

加载中...

上云服务

沪ICP备14033669号-10