- 上云资讯 -
2025-01-12 03:16:19 60人关注
北大/通研院发布超难基准LooGLE测试长文本理解 大模型全军覆没!
在自然语言处理领域,长语境理解一直是一个挑战。尽管大型语言模型(LLMs)在多种语言任务上表现出色,但它们在处理超出其上下文窗口大小的文本时常常受限。为了克服这一限制,研究者们一直在努力提升LLMs对长文本的理解能力,这不仅对于学术研究具有重要意义,对于现实世界的应用场景,如特定领域的知识理解、长对话生成、长故事或代码生成等,同样至关重要。
2024-12-29 11:29:33 77人关注
DeepMind推新基准Michelangelo:揭示长上下文 LLM推理缺陷
最近,超长上下文窗口的大型语言模型(LLMs)成为了人们讨论的热点。这些模型能够在一个提示中处理数十万甚至上百万个标记,为开发者开启了许多新的可能性。不过,这些长上下文 LLM 到底能多好地理解和利用所接收到的大信息呢?