DoubleDQN

2023-11-18 RL 评论

过估计现象

QLearning在低维状态下的成功以及DQN和target DQN的效果以及很好了，但是人们发现了一个问题，这些算法都会过高估计Q值

本文链接： http://whosejam.github.io/2023/11/18/DoubleDQN/

版权声明： 本博客所有文章除特别声明外，均采用 CC BY 4.0 CN协议许可协议。转载请注明出处！