- 上云资讯 -
                
                
                
                    阿里云云原生
                
                
                
                    阿里云开发者
                
                
                
                    腾讯云开发者
                
                
                
                    火山引擎开发者社区
                
                
                
                    魔搭ModelScope社区
                
                
                
                    微软科技
                
                
                
                    Azure云科技
                
                
                
                    Zilliz
                
                
                
                    OpenAI
                
                
                
                    Anthropic
                
                
                
                    Gemini
                
                
                
                    LangChain
                
                
                
                    Hugging Face
                
                
                
                    Mistral
                
                
            
            
            
                2025-04-21 10:39:27 168人关注
OpenAI o3 模型测试成绩遭质疑,实际表现远低于宣传
近日,OpenAI 推出的 o3人工智能模型在基准测试中的表现引发了广泛争议。尽管 OpenAI 在去年12月首次发布 o3时自信地宣称该模型在极具挑战性的 FrontierMath 数学问题集上能够正确回答超过四分之一的问题,但这一声称与最近的独立测试结果形成鲜明对比。
