- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2024-12-16 19:11:34 67人关注
Meta 推出全新 Multi-IF 基准,挑战多轮多语言指令遵循能力
Meta 最近发布了一项全新的基准测试,名为 Multi-IF,旨在评估大语言模型(LLM)在多轮对话和多语言环境下的指令遵循能力。这一基准覆盖了八种语言,包含4501个三轮对话任务,重点探讨了当前模型在复杂多轮和多语言场景中的表现。
Meta Multi-IF Benchmark 多语言指令遵循基准 多语言AI模型评估 AI指令跟随测试 多语言指令性能评测