上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-01-12 03:16:19 278人关注

北大/通研院发布超难基准LooGLE测试长文本理解大模型全军覆没！

在自然语言处理领域，长语境理解一直是一个挑战。尽管大型语言模型（LLMs）在多种语言任务上表现出色，但它们在处理超出其上下文窗口大小的文本时常常受限。为了克服这一限制，研究者们一直在努力提升LLMs对长文本的理解能力，这不仅对于学术研究具有重要意义，对于现实世界的应用场景，如特定领域的知识理解、长对话生成、长故事或代码生成等，同样至关重要。

PKU研究院 Loogle基准测试 AI研究机构大模型评测标准学术研究进展

2024-12-29 11:29:33 346人关注

DeepMind推新基准Michelangelo：揭示长上下文 LLM推理缺陷

最近，超长上下文窗口的大型语言模型（LLMs）成为了人们讨论的热点。这些模型能够在一个提示中处理数十万甚至上百万个标记，为开发者开启了许多新的可能性。不过，这些长上下文 LLM 到底能多好地理解和利用所接收到的大信息呢?

DeepMind新基准 Michelangelo模型长上下文LLM缺陷大模型评测标准 LLM性能评估

- 上云资讯 -

北大/通研院发布超难基准LooGLE测试长文本理解大模型全军覆没！

DeepMind推新基准Michelangelo：揭示长上下文 LLM推理缺陷

推荐阅读

上云服务

- 上云资讯 -

北大/通研院发布超难基准LooGLE测试长文本理解 大模型全军覆没！

DeepMind推新基准Michelangelo：揭示长上下文 LLM推理缺陷

推荐阅读

上云服务

北大/通研院发布超难基准LooGLE测试长文本理解大模型全军覆没！