- 上云资讯 -
阿里云云原生
阿里云开发者
腾讯云开发者
火山引擎开发者社区
魔搭ModelScope社区
微软科技
Azure云科技
Zilliz
OpenAI
Anthropic
Gemini
LangChain
Hugging Face
Mistral
2025-05-06 08:34:17 71人关注
OpenAI最新基准测试:AI编程能力达人类四分之一,显现局限性
OpenAI近日发布了一项重要的AI编程能力评估报告,通过价值100万美元的实际开发项目揭示了AI在软件开发领域的现状。这项名为SWE-Lancer的基准测试涵盖了1,400个来自Upwork的真实项目,全面评估AI在直接开发和项目管理两大领域的表现。
2025-01-10 01:35:27 115人关注
DeepMind联合创始人:人工智能能力被夸大 长期潜力未被充分认识
DeepMind联合创始人Demis Hassabis近日在一档播客中表示,当前的人工智能能力被过度夸大了。然而,他同时强调,这项技术的长期潜力,特别是在通用人工智能(AGI)方面,依然被低估。