上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-05-04 10:28:43 2656人关注

AI大语言模型幻觉排行榜：Gemini 2.0 Flash幻觉最低

近日，Vectara 发布了一份名为 “幻觉排行榜” 的报告，比较了不同大型语言模型（LLM）在总结短文档时产生幻觉的表现。这份排行榜利用了 Vectara 的 Hughes 幻觉评估模型(HHEM-2.1)，该模型定期更新，旨在评估这些模型在摘要中引入虚假信息的频率。根据最新数据，报告指出了一系列流行模型的幻觉率、事实一致性率、应答率以及平均摘要长度等关键指标。

AI大模型大模型幻觉排名大模型幻觉问题 Gemini大模型大模型技术评估

2025-03-13 18:14:31 920人关注

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

近日，Vectara 的机器学习团队对 DeepSeek 系列的两款模型进行了深入的幻觉测试，结果显示，DeepSeek-R1的幻觉率高达14.3%，显著高于其前身 DeepSeek-V3的3.9%。这表明，在增强推理的过程中，DeepSeek-R1产生了更多不准确或与原始信息不一致的内容。该结果引发了对推理增强大语言模型（LLM）产生幻觉率的广泛讨论。

DeepSeek R1 大模型幻觉问题推理准确性提升 DeepSeek R1模型优化大模型推理技术

2025-01-14 00:32:17 208人关注

Meta AI 报特朗普被暗杀事件未发生，高管归咎于AI幻觉问题

最近，Meta 公司的人工智能助手在谈到前总统唐纳德・特朗普的暗杀未遂事件时，竟然错误地声称这件事根本没有发生。这一错误引发了广泛关注，Meta 公司的高管也对此表示遗憾。

Meta AI 特朗普遇刺 AI幻觉 AI大模型幻觉问题 Meta AI新闻

2025-01-10 16:12:19 601人关注

智谱GLM-4-9B模型幻觉率仅1.3%，在全球大模型评测中夺魁

在人工智能领域，大语言模型的"幻觉问题"一直是困扰业界的关键挑战。近日，一项基于HHEM-2.1-Open评估体系的测试结果显示，智谱AI旗下的GLM-4-9B模型交出了一份令人瞩目的成绩单。

智谱GLM-4-9B模型大模型幻觉率 AI大模型技术 GLM-4-9B应用场景 1.3%幻觉率突破

2025-01-03 23:18:35 291人关注

告别幻觉！谷歌推新模型DataGemma，统计数据准确率暴涨58%

近日，谷歌宣布推出新的开源 AI 模型 DataGemma，旨在解决大语言模型（LLM）在处理统计数据时常出现的 “幻觉” 问题。

幻觉消除技术 Google Datagemma模型大模型幻觉问题 AI模型优化 Google AI技术进展

2024-12-20 18:34:11 265人关注

李彦宏：大模型幻觉问题基本解决不再胡说八道

在2024世界百度大会上，百度创始人李彦宏带来了一系列引人瞩目的AI领域最新进展。他指出，过去两年大模型技术最显著的突破在于"幻觉"问题的基本解决，这标志着AI回答的准确性获得质的飞跃，使其从"一本正经地胡说八道"转变为可靠的智能助手。

李彦宏大模型幻觉大模型幻觉解决大模型技术突破百度大模型进展

- 上云资讯 -

AI大语言模型幻觉排行榜：Gemini 2.0 Flash幻觉最低

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

Meta AI 报特朗普被暗杀事件未发生，高管归咎于AI幻觉问题

智谱GLM-4-9B模型幻觉率仅1.3%，在全球大模型评测中夺魁

告别幻觉！谷歌推新模型DataGemma，统计数据准确率暴涨58%

李彦宏：大模型幻觉问题基本解决不再胡说八道

推荐阅读

上云服务

- 上云资讯 -

​AI大语言模型幻觉排行榜：Gemini 2.0 Flash幻觉最低

DeepSeek-R1 模型幻觉问题严重，推理能力与准确性面临挑战

Meta AI 报特朗普被暗杀事件未发生，高管归咎于AI幻觉问题

智谱GLM-4-9B模型幻觉率仅1.3%，在全球大模型评测中夺魁

告别幻觉！谷歌推新模型DataGemma，统计数据准确率暴涨58%

李彦宏：大模型幻觉问题基本解决 不再胡说八道

推荐阅读

上云服务

AI大语言模型幻觉排行榜：Gemini 2.0 Flash幻觉最低

李彦宏：大模型幻觉问题基本解决不再胡说八道