如果您需要任何上云服务
请随时联系我们:
电话:021-50583875
2025-01-23 17:31:10 138人关注
在2024年12月19日的发布会上,智源研究院与腾讯宣布推出LongBench v2,这是一个专为评估大语言模型(LLMs)在真实世界长文本多任务中的深度理解与推理能力而设计的基准测试。该平台旨在推动长文本模型在理解和推理方面的进步,回应了当前长文本大语言模型在应用中的挑战。
智源 腾讯 LongBench V2 大模型评测 AI评测基准