微信扫码
添加专属顾问
2025-01-10 10:27:14 71人关注
近期,康奈尔大学等机构的研究人员对包括GPT-4o、Claude和Gemini在内的多个生成式AI模型进行了幻觉基准测试。研究发现,即使是最先进的模型也只有约35%的时间能生成无幻觉文本,表明AI可靠性仍有待提高。
AI模型幻觉研究 AI幻觉成因 AI模型研究 AI幻觉解决方案 AI模型可靠性提升
2024-12-31 04:36:20 78人关注
最近,剑桥大学等团队发表了一篇重磅论文,揭示了大模型(LLM)们的真实面目,深入剖析了当前大语言模型(LLM)的实际表现,结果令人震惊 —— 这些被寄予厚望的AI模型,在很多基本任务上的表现远不如人们想象的那样出色。
Cambridge AI研究 AI模型研究 剑桥大学AI研究 AI技术前沿 AI模型发展