上云资讯 - 来上云吧，企业上云一站式服务

阿里云云原生阿里云开发者腾讯云开发者火山引擎开发者社区魔搭ModelScope社区微软科技 Azure云科技 Zilliz OpenAI Anthropic Gemini LangChain Hugging Face Mistral

2025-10-13 14:30:24 308人关注

斯坦福研究团队发布 AgentFlow：为模块化、工具使用的 AI 代理提供新一代强化学习框架

斯坦福大学的研究团队最近发布了 AgentFlow，这是一个可训练的智能代理框架，旨在通过模块化设计和工具集成，提升 AI 的智能决策能力。AgentFlow 由四个模块组成:规划器（Planner）、执行器(Executor)、验证器(Verifier)和生成器(Generator)，并通过显式内存进行协调。在每一步中，规划器会提出子目标并选择适当的工具和上下文，执行器则负责调用工具，验证器则判断是否继续，而生成器则在任务完成后给出最终答案。

2025-08-08 09:35:18 618人关注

微软发布Agent Lightning强化学习框架，声称可训练任何AI代理系统

微软研究院推出一款名为Agent Lightning的全新强化学习训练框架，旨在解决当前AI代理系统训练过程中面临的通用性和灵活性挑战。该框架通过创新的解耦设计，能够对不同架构的AI代理进行统一的强化学习训练。

强化学习训练框架 AI代理系统训练 Agent Lightning 强化学习通用性挑战 AI代理灵活性优化

2025-04-21 16:31:28 241人关注

新框架d1引领扩散模型推理进步，掀起强化学习应用新风潮

在人工智能的不断发展中，扩散模型在推理能力上逐渐崭露头角，现如今，它们不再是自回归模型的 “跟随者”。近日，来自加州大学洛杉矶分校（UCLA）和 Meta 的研究者们联合推出了一种名为 d1的新框架，该框架结合了监督微调(SFT)和强化学习(RL)，使扩散模型具备更强的推理能力，包括数学理解、逻辑推理等。

D1扩散模型强化学习框架扩散模型技术 AI模型框架强化学习应用

- 上云资讯 -

斯坦福研究团队发布 AgentFlow：为模块化、工具使用的 AI 代理提供新一代强化学习框架

微软发布Agent Lightning强化学习框架，声称可训练任何AI代理系统

新框架d1引领扩散模型推理进步，掀起强化学习应用新风潮

推荐阅读

上云服务