0%

pytorch实现Double DQN

发表于 2021-05-22 更新于 2022-03-28

Double DQN是DQN的改进，通过解耦目标Q值动作的选择和目标Q值的计算这两步，来达到消除过度估计的问题。

您好, 这里需要密码.