上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-04-08 10:18:13 249人关注

Meta Llama4强势登场，却在长上下文任务中翻车

一项新的独立评估显示，Meta 最新推出的 Llama4模型——Maverick 和 Scout 在标准测试中表现出色，但在复杂长上下文任务中表现欠佳。根据人工智能分析的“智能指数”，Maverick 得分49分，领先 Claude3.7Sonnet（得分未具体列出），但落后于 Deepseek V30324(53分);Scout 得分36分，与 GPT-4o-mini 相当，优于 Claude3.5Sonnet 和 Mistral Small3.1。两款模型在推理、编码和数学任务中表现稳定，未显示明显短板。

Meta Llama4 长上下文处理问题大模型失败案例 Llama4技术缺陷长文本处理挑战

2025-01-16 21:24:44 687人关注

AI大模型集体翻车！9.11和9.9哪个大？月之暗面回应大模型称9.11大于9.9

最近，一道简单的小学数学题却让不少AI大模型"翻了车"，12个国内外知名的AI大模型中，8个模型在回答"9.11和9.9哪个大"这个问题时都答错了。

AI大模型失败案例月球背面AI响应问题 AI模型局限性分析 AI技术挑战 AI在极端环境应用

- 上云资讯 -

Meta Llama4强势登场，却在长上下文任务中翻车

AI大模型集体翻车！9.11和9.9哪个大？月之暗面回应大模型称9.11大于9.9

推荐阅读

上云服务