
强化学习
文章平均质量分 90
星水天河
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【强化学习系列】Q-learning——从贝尔曼最优方程谈起
介绍如何从贝尔曼最优方程得到Q-learning的更新公式,以及为什么Q-learning是off-policy的策略(异策略)原创 2025-04-29 20:53:25 · 1151 阅读 · 0 评论 -
【强化学习系列】贝尔曼最优方程详细推导过程
分别介绍了动作价值和状态价值形式的贝尔曼最优方程的推导过程,辨析了最优策略和最优状态价值的概念原创 2025-04-28 21:32:54 · 997 阅读 · 0 评论 -
【强化学习系列】贝尔曼方程
图文结合介绍强化学习中贝尔曼方程的推导过程原创 2025-04-28 18:04:29 · 779 阅读 · 0 评论