微信扫码
添加专属顾问
2024-12-30 20:33:20 150人关注
北京智源人工智能研究院(BAAI)最近推出了全球首个中文大模型辩论平台FlagEval Debate。这一新平台旨在通过模型辩论这一竞争机制,为大语言模型的能力评估提供新的度量方式。它是智源模型对战评测服务FlagEval大模型角斗场的扩展,目标是甄别大语言模型之间的能力差异。
Flageval 中文大模型 大模型评测 大模型辩论 大模型技术评估 中文模型性能对比