斯坦福的公开课 CS 224R 深度强化学习课程主页: cs224r.stanford.edu/讲课视频刚全部传至youtube: www.youtube.com/watch?v=EvHRQhMX7_w&list=PLoROMvodv4rPwxE0ONYRa_itZFdaKCylL人类、动物和机器人面对这个世界时,必须做出决策并采取行动。而且,他们选择的决策会影响他们所处的世界,必须考虑这些结果。本课程讲解深度强化学习的算法——一种通过经验学习行为的方法,重点介绍使用深度神经网络从高维观察中学习行为的实用算法。课程内容将包括从示范中学习的方法,基于模型和无模型的深度强化学习方法,从离线数据集学习的方法,以及更高级的技术,如目标条件强化学习(Goal-conditioned RL)、元强化学习(Meta-RL)和无监督技能发现等。这些方法将通过高维状态和动作空间的领域实例进行讲解,例如机器人学、视觉导航和控制。该课程与CS234互为补充,并且两者不互为前置课程。与CS234相比,本课程将更加注重应用和深度学习,重点关注机器人学和语言建模中的使用案例。科技先锋官

