whoseJam
×
Toggle navigation
首页
归档
分类
标签
项目
书单
友链
关于
DoubleDQN
2023-11-18
RL
评论
过估计现象
QLearning在低维状态下的成功以及DQN和target DQN的效果以及很好了,但是人们发现了一个问题,这些算法都会过高估计Q值
上一篇
下一篇