上云资讯 - 来上云吧，企业上云一站式服务

2025-01-10 10:16:21 172人关注

AI遇上"死亡挑战"：当机器人被要求把大象塞进冰箱

在这个AI满天飞的时代，我们对智能助手的要求可是越来越高了。不光要能说会道，还得能看图识字，最好再来点逗趣幽默。但是，你有没有想过，如果给AI一个自相矛盾的任务，它会不会当场"宕机"呢?比如，你让它把大象塞进冰箱，还不许大象变冷，它会不会傻眼?

2025-01-01 23:25:26 399人关注

随着OpenAI的GPT-4在传统数学评测中屡创佳绩，北京大学和阿里巴巴的研究团队联手推出了一个全新的评测基准——Omni-MATH，旨在评估大型语言模型在奥林匹克数学竞赛级别的推理能力。这一举措不仅为AI数学能力的评估提供了新标准，也为探索AI在高级数学领域的潜力开辟了新途径。