- 上云资讯 -
2025-04-08 10:18:13 39人关注
Meta Llama4强势登场,却在长上下文任务中翻车
一项新的独立评估显示,Meta 最新推出的 Llama4模型——Maverick 和 Scout 在标准测试中表现出色,但在复杂长上下文任务中表现欠佳。根据人工智能分析的“智能指数”,Maverick 得分49分,领先 Claude3.7Sonnet(得分未具体列出),但落后于 Deepseek V30324(53分);Scout 得分36分,与 GPT-4o-mini 相当,优于 Claude3.5Sonnet 和 Mistral Small3.1。两款模型在推理、编码和数学任务中表现稳定,未显示明显短板。
2025-01-16 21:24:44 416人关注
AI大模型集体翻车!9.11和9.9哪个大?月之暗面回应大模型称9.11大于9.9
最近,一道简单的小学数学题却让不少AI大模型"翻了车",12个国内外知名的AI大模型中,8个模型在回答"9.11和9.9哪个大"这个问题时都答错了。