斯坦福的公开课CS224R深度强化学习课程主页：cs224r.stan

蚁工厂 2025-12-10 08:57:48

斯坦福的公开课 CS 224R 深度强化学习课程主页： cs224r.stanford.edu/讲课视频刚全部传至youtube： www.youtube.com/watch?v=EvHRQhMX7_w&list=PLoROMvodv4rPwxE0ONYRa_itZFdaKCylL人类、动物和机器人面对这个世界时，必须做出决策并采取行动。而且，他们选择的决策会影响他们所处的世界，必须考虑这些结果。本课程讲解深度强化学习的算法——一种通过经验学习行为的方法，重点介绍使用深度神经网络从高维观察中学习行为的实用算法。课程内容将包括从示范中学习的方法，基于模型和无模型的深度强化学习方法，从离线数据集学习的方法，以及更高级的技术，如目标条件强化学习（Goal-conditioned RL）、元强化学习（Meta-RL）和无监督技能发现等。这些方法将通过高维状态和动作空间的领域实例进行讲解，例如机器人学、视觉导航和控制。该课程与CS234互为补充，并且两者不互为前置课程。与CS234相比，本课程将更加注重应用和深度学习，重点关注机器人学和语言建模中的使用案例。科技先锋官

0 阅读：0

感谢大家的关注

作者最新文章

1

一张图看大模型里 KV Caching 的原理。制图：Daily Dose of

2

面壁小钢炮的语音合成/语音克隆模型 VoxCPM发了个新版本： VoxCPM1.

3

00后买油车是情怀还是清醒现在的00后选车，似乎越来越难用“潮流”简单定义了。他

4

Meta也对阿里千问上瘾？昨天彭博给Meta爆了好多料啊。。里面提到的：Meta

5

第一个在太空中训练的LLMStarcloud上月中旬发射了一颗搭载英伟达H100

6

200k 的上下文窗口就足够了~ampcode.com/200k-tokens-

7

github.com/AfaanBilal/NanoCore教学项目NanoCo

8

分享图片

9

《从零开始构建智能体》从基础理论到实际应用，全面掌握智能体系统的设计与实现在线阅

10

www.elijahkurien.com/interp一份研究大模型可解释性的博

热门分类

科技TOP

1

发布会还没有开，价格配置就全曝光了，荣耀手机的保密措施急需改进啊！如果爆料价格

2

【：最强Mate机皇】华为终端官宣将于11月25日举行华为Mate80系列/M

3

小米澎湃OS微信聊天能发实况图澎湃OS现在正式支持在微信聊天框发Live图了。

4

蹲完发布会价格环节直接惊到！标准版5499起，Pro版6999起，ProMax

5

华为Mate80真香！一下子拿下两台！Mate30正式退居二线

6

细思极恐，华为这招是真的高原来4699起的Mate80系，只是个开胃菜，大家

7

华为Mate80系列发布会大家在看了吗，开局歌声太雅了。全系2.5D玻璃+直角中

8

MagicOS10迎来重大更新，升级至116版本，内容很多，有1.2GB新增

9

护眼还得看荣耀！这几款“养眼”神机可以闭眼入👀长时间刷手机眼睛酸涩干痒？

10

荣耀GT2系列要来了。9000mAh大电池再破轻薄青海湖电池记录，续航再升级。网

科技最新文章

1

看到12月生产的华为mate80proMax，真的震惊了我的三观，现产现发，完

2

字越少，事越大差距已经越拉越大了我天真的以为华为Mate80系列就是年底的王

3

荣耀老机型用户们，荣耀没有忘记大家，久等了！MagicOS9.0系统的更新端

4

余承东忍住了，Nova15还是被猪队友给曝光了，华为这是憋了一个王炸啊，说句难听

5

荣耀全新旗舰序列正式就位！定位仅次于Magic系列，核心配置一次拉满——旗舰性能

6

这下又尴尬了离开了赵明，荣耀却越来越好了赵明在的时候，网友吐槽不舍得给荣耀

7

从GT到WIN，不仅是改名，荣耀电竞新系列真要动真格了，更是亮出刀锋直指电竞赛道

8

从全球最新的存储芯片份额看，NAND和DRAM依然被韩国的三星和SK公司所垄断，

9

荣耀GT系列改名为WIN系列？已经在某东开启预约了，看Deco有点像

10

小米招聘AI教育岗位这不是小米第一次布局教育。今年7月，REDMIPad2就