微信扫码
添加专属顾问
2024-12-19 09:13:25 90人关注
强化学习在近年来取得了许多成功,但其样本效率低下,限制了其在现实世界中的应用。世界模型作为一种环境生成模型,为解决这一问题提供了希望。它可以作为模拟环境,以更高的样本效率训练强化学习智能体。
扩散模型 Atari 100K基准 扩散模型SOTA 扩散模型性能优化 Atari游戏AI