上云资讯 - 来上云吧，企业上云一站式服务

2025-01-10 10:27:14 307人关注

研究表明即使是最好的人工智能模型也会产生许多幻觉

近期，康奈尔大学等机构的研究人员对包括GPT-4o、Claude和Gemini在内的多个生成式AI模型进行了幻觉基准测试。研究发现，即使是最先进的模型也只有约35%的时间能生成无幻觉文本，表明AI可靠性仍有待提高。

2024-12-31 04:36:20 295人关注

最近，剑桥大学等团队发表了一篇重磅论文，揭示了大模型（LLM）们的真实面目，深入剖析了当前大语言模型(LLM)的实际表现，结果令人震惊 —— 这些被寄予厚望的AI模型，在很多基本任务上的表现远不如人们想象的那样出色。