“强化学习”的版本历史

跳转至: 导航搜索

差异选择:选中要对比的版本的单选按钮,按Enter键或下方的按钮。
说明:(当前)=与最后版本之间的差异,(之前)=与上一版本之间的差异,=小编辑。

  • (当前 | 之前) 2025年2月4日 (二) 23:10江南仁讨论 | 贡献. . (5,142字节) (+5,142). . (创建页面,内容为“{{4}}强化学习是一种通过与环境交互来学习策略的方法,其目标是最大化某种累积奖励。<br> '''1. 强化学习(Reinforcement Learning,…”)