内容列表

  • 2022-05-01 1 1,190
    深度强化学习(DRL 5) - 优先回放DQN(Prioritized experience replay)

    目录 一、优先回放 二、代码 参考 全部代码 https://github.com/ColinFred/Reinforce_Learning_Pytorch/tree/main/RL/DQN 一、优先回放 在经验回放中是利用均匀分布采样,而这种方式看上去并不高效,对于智能体而言,这些数据的重要程度并不一样,因此提出优先回放(Prioritized Replay)的方法。优先回放的基本思想就是打破均...

  • 2022-05-01 0 828
    深度强化学习(DRL 3) - 从Q-learning到Deep Q Network(DQN)

    目录 一、Q-learning 二、Deep Q Network 三、Double DQN 一、Q-learning 关于Q-learning,网上的资料很多。 Q-learning最核心的是有一个Q表,它记录了在环境中的 所有状态(s) 以及每个状态可以进行的 所有行为(a) 的Q值,初值设为0。 状态 \ 行为 a1 a2 a3 a4 s1 s2 s3 …… Q值的更新公式如下: Q ( s ...