上云资讯 - 来上云吧，企业上云一站式服务

2025-12-18 08:36:27 154人关注

AI 科学研究新基准:FrontierScience 评估模型推理能力

在科学研究中，推理能力至关重要。科学家们不仅仅是回忆事实，还需提出假设、测试并修正这些假设，并在不同领域之间综合思想。随着 AI 模型能力的提升，如何评估它们在科学研究中深度推理的能力成为了一个重要问题。

AI

2025-06-17 15:40:19 1849人关注

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

近日，豆包大模型迎来了全新1.6版本，标志着其综合能力的再次跃升。在推理、数学、指令遵循等多个核心领域，豆包1.6实现了显著的性能提升，同时大幅降低了用户使用的门槛，推动 AI Agent 在消费电子、汽车、金融等行业的快速应用。

豆包大模型1.6 大模型性能提升 AI Agent行业应用大模型推理能力大模型数学能力指令遵循优化

2025-05-31 16:28:40 225人关注

研究人员揭示大模型并非真正推理，只是在 “找关系”

随着人工智能（AI）技术的飞速发展，越来越多的研究人员开始对大型语言模型(如 ChatGPT)进行深入探讨。近日，亚利桑那州立大学的研究小组在预印本平台 arXiv 上发表了一项引人关注的论文，指出我们对这些 AI 模型的理解可能存在误区。他们认为，这些模型实际上并不会进行真正的思考或推理，而仅仅是在寻找相关性。

模型推理能力 AI模型推理研究模型推理技术 AI推理模型评估模型推理性能优化

2025-03-18 10:35:32 380人关注

CMU 团队推出元强化微调：提升大语言模型推理能力的新范式

在人工智能领域，大语言模型（LLM）正在不断进化，最近，卡内基梅隆大学(CMU)与 HuggingFace 的研究者们共同提出了一种名为 “元强化微调”(Meta Reinforcement Fine-Tuning，简称 MRT)的新方法。这一方法旨在优化大语言模型在测试时的计算效率，尤其是在解决复杂推理问题时，表现尤为突出。

CMU团队 Meta强化学习模型微调技术强化学习优化 AI模型训练方法

2025-02-25 10:37:39 349人关注

新型语言模型 Huginn：突破推理界限无需语言即可“思考”

近日，来自图宾根埃利斯研究所、马里兰大学和劳伦斯利弗莫尔国家实验室的研究团队，开发出名为 Huginn 的新型语言模型，该模型采用递归架构，显著提升了推理能力。与传统模型不同，Huginn 无需专门的“推理链”训练，便可在神经网络的“潜在空间”内自主推理，再输出结果。

Huginn语言模型语言模型推理突破推理边界突破大模型推理能力 Huginn模型技术解析

2025-02-08 10:34:35 394人关注

科大讯飞将于1月15日推出全新深度推理模型 X1，增强智慧办公能力

在1月7日举办的办公智能体产品升级发布会上，科大讯飞宣布将于1月15日推出其最新的 “讯飞星火深度推理模型 X1”。此次发布将为讯飞的智能办公产品注入更强大的人工智能能力，预计将进一步拓展智慧办公的应用边界。

科大讯飞X1 深度推理模型大模型推理能力 AI推理技术讯飞X1应用场景

2025-01-17 18:11:15 277人关注

大语言模型推理能力被高估了在不熟悉场景中有很大的弱点

近期，麻省理工学院（MIT）的研究团队对大型语言模型(LLMs)进行了深入的研究，探讨它们在不同任务下的表现。他们发现，尽管这些模型在一些常见的任务上看起来很出色，但实际上它们的推理能力常常被高估，尤其是在面对不熟悉的情境时。

大语言模型语言模型弱点语言模型评估语言模型应用场景语言模型性能

2025-01-17 14:15:40 248人关注

OpenAI草莓计划揭秘：Q*推理能力大爆发，未来触手可及！

近日，OpenAI悄无声息地揭开了「草莓」计划的神秘面纱。这个项目，之前被称为Q*，现在以草莓的身份重新登场，据说它能让AI提前规划任务，自主上网搜集信息，甚至进行深入研究。

OpenAI Strawberry计划 Q Reasoning AI推理技术 OpenAI最新研究 AI模型推理能力提升

2025-01-15 10:39:40 395人关注

科大讯飞发布讯飞星火深度推理模型 X1

今日，科大讯飞正式发布了其首个基于全国产算力平台训练的深度推理大模型——讯飞星火深度推理模型X1。这一创新成果标志着科大讯飞在人工智能领域取得了又一重大进展。

科大讯飞星火X1 深度推理模型大模型推理能力 AI大模型技术

2025-01-07 20:16:18 266人关注

AI界的推理大师！OpenAI的“草莓”熟了，"GPT-5猎户座"即将闪耀登场

在全球AI技术的激烈竞争中，OpenAI再次发力，准备在今年秋天推出一款代号为「草莓」的模型。这款模型不仅能够大幅强化推理能力，还将成为生成数据的源泉，为未来的GPT-5提供强大的支持。

AI推理技术 GPT5解析 Orion模型大模型推理能力 AI技术前沿动态

2025-01-03 01:24:29 286人关注

OpenAI新模型o1更擅长推理，但“撒谎” 能力也更强

近日，OpenAI 发布了他们最新的推理模型 o1，受到了广泛关注。然而，在发布前不久，独立的 AI 安全研究公司 Apollo 发现了一个引人注目的现象 —— 这个模型竟然能够 “撒谎”。这让很多人对 AI 模型的可靠性产生了疑问。

OpenAI Model O1 Reasoning模型模型推理能力 AI模型说谎大模型技术突破

2024-12-29 08:40:12 744人关注

超强推理能力！Kimi探索版开启内测：解决复杂搜索问题

日前，不少用户反馈， Kimi已经开始内测"探索版"，获得内测资格的用户只要在输入框中输入 “/”，就能看到新的功能选项。

超级推理 Kimi探索版 AI推理技术大模型推理能力 Kimi探索版测试

2024-12-28 20:28:32 331人关注

苹果研究揭示:大语言模型推理能力严重缺陷

最近，苹果公司进行了一项关于大语言模型（LLM）推理能力的研究，引发了人们对这些模型在数学领域表现的关注。

AI大模型推理缺陷 LLM推理问题研究 Apple研究报告大模型技术局限性 LLM推理能力分析

2024-12-28 15:40:11 300人关注

创新开源框架OpenR 有效提升大模型推理能力

一个名为OpenR的创新开源框架近日问世，旨在解决大型语言模型（LLMs）在复杂推理任务中的短板。这一由伦敦大学学院、利物浦大学、上海交通大学、香港科技大学(广州)和西湖大学研究人员联合开发的框架，通过结合测试时计算、强化学习和过程监督，为提升LLMs的推理能力开辟了新途径。

OpenR框架大模型推理优化大模型推理加速 OpenR框架应用大模型性能提升

2024-12-23 10:22:32 245人关注

OpenAI发布o3：AI 推理能力的重大突破，得分高达 87.5%

OpenAI 正式发布了其最新的 o-Model 推理系列模型 ——OpenAI o3。作为继任者，o3在数学和科学推理方面展现了显著的进步，引发了业界对其能力与局限性的广泛讨论。

OpenAI O3 AI Reasoning突破 AI推理技术大模型推理能力 OpenAI最新研究成果

- 上云资讯 -

AI 科学研究新基准:FrontierScience 评估模型推理能力

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

研究人员揭示大模型并非真正推理，只是在 “找关系”

CMU 团队推出元强化微调：提升大语言模型推理能力的新范式

新型语言模型 Huginn：突破推理界限无需语言即可“思考”

科大讯飞将于1月15日推出全新深度推理模型 X1，增强智慧办公能力

大语言模型推理能力被高估了在不熟悉场景中有很大的弱点

OpenAI草莓计划揭秘：Q*推理能力大爆发，未来触手可及！

科大讯飞发布讯飞星火深度推理模型 X1

AI界的推理大师！OpenAI的“草莓”熟了，"GPT-5猎户座"即将闪耀登场

OpenAI新模型o1更擅长推理，但“撒谎” 能力也更强

超强推理能力！Kimi探索版开启内测：解决复杂搜索问题

苹果研究揭示:大语言模型推理能力严重缺陷

创新开源框架OpenR 有效提升大模型推理能力

OpenAI发布o3：AI 推理能力的重大突破，得分高达 87.5%

推荐阅读

上云服务

- 上云资讯 -

AI 科学研究新基准:FrontierScience 评估模型推理能力

豆包大模型再进化！全球领先，AI Agent 应用加速落地！

研究人员揭示大模型并非真正推理，只是在 “找关系”

CMU 团队推出元强化微调：提升大语言模型推理能力的新范式

新型语言模型 Huginn：突破推理界限 无需语言即可“思考”

科大讯飞将于1月15日推出全新深度推理模型 X1，增强智慧办公能力

​大语言模型推理能力被高估了 在不熟悉场景中有很大的弱点

OpenAI草莓计划揭秘：Q*推理能力大爆发，未来触手可及！

科大讯飞发布讯飞星火深度推理模型 X1

AI界的推理大师！OpenAI的“草莓”熟了，"GPT-5猎户座"即将闪耀登场

OpenAI新模型o1更擅长推理，但“撒谎” 能力也更强

超强推理能力！Kimi探索版开启内测：解决复杂搜索问题

苹果研究揭示:大语言模型推理能力严重缺陷

创新开源框架OpenR 有效提升大模型推理能力

OpenAI发布o3：AI 推理能力的重大突破，得分高达 87.5%

推荐阅读

上云服务

新型语言模型 Huginn：突破推理界限无需语言即可“思考”

大语言模型推理能力被高估了在不熟悉场景中有很大的弱点