0%

pytorch实现Dueling DQN

发表于 2021-05-27 更新于 2022-03-28

Dueling DQN是DQN的改进，通过调整网络结构使得网络可以学到更为准确的状态价值的估值，从而更有效地找到好的策略（学习所需的试验轮数更少）。

您好, 这里需要密码.