2025-01-12 03:16:19
60人关注
北大/通研院发布超难基准LooGLE测试长文本理解 大模型全军覆没!
在自然语言处理领域,长语境理解一直是一个挑战。尽管大型语言模型(LLMs)在多种语言任务上表现出色,但它们在处理超出其上下文窗口大小的文本时常常受限。为了克服这一限制,研究者们一直在努力提升LLMs对长文本的理解能力,这不仅对于学术研究具有重要意义,对于现实世界的应用场景,如特定领域的知识理解、长对话生成、长故事或代码生成等,同样至关重要。
PKU研究院
Loogle基准测试
AI研究机构
大模型评测标准
学术研究进展