您的位置:首页 > 教育 > 大学 > 资源 | 学到了!UC Berkeley CS 294深度强化学习课程(附视频与PPT)

资源 | 学到了!UC Berkeley CS 294深度强化学习课程(附视频与PPT)

2018-04-02 来源:  浏览:    关键词:学习 强化 课程 介绍 深度
原标题:资源 | 学到了!UC Berkeley CS 294深度强化学习课程(附视频与PPT)
CS294 深度强化学习 2017 年秋季课程的一切资源现已放出。该课程为各位读者供给了强化学习的进阶资源,且广泛触及深度强化学习的基本理论与前沿应战。本文介绍了该课程首要评论的强化学习主题,读者可根据兴趣爱好与布景常识挑选不同部分的课程。请注意,UC Berkeley 的 CS 294 并未被归类为在线敞开课程,一切视频的运用权仅限个人学习。
本课程要求具有 CS 189 或同等学力。本课程将假定你已了解强化学习、数值优化和机器学习的相关布景常识。本课程所需的布景材料已在下表列出。在课程中,授课人会回忆这些材料的内容,但会十分简略。
强化学习和 MDP MDP 的界说 准确算法:战略与价值迭代 搜索算法 数值优化 梯度下降、随机梯度下降 反向传达算法 机器学习 分类和回归问题:运用哪些丢失函数,怎么拟合线性和非线性模型 练习/测验过错、过拟合
有关强化学习与 MDP 的介绍材料:
有关机器学习和神经网络的介绍性材料,请参阅:
以下是 CS 294 深度强化学习 2017 年秋季课程的首要内容概要,一切的授课文档与视频都现已发布且展现在课程主页中。

该课程第一节课首要是课程介绍和对强化学习基本概念的介绍。
该课程教学大纲中包含以下内容:
1. 从监督学习到决议计划
2. 根底强化学习:Q 学习和战略梯度
3. 高档模型学习和猜测、distillation、奖赏学习
4. 高档深度强化学习:相信域战略梯度、actor-critic 办法、探究
5. 敞开性问题、学术讲座、特邀陈述
8 月 28 日:监督学习和仿照学习(Levine)

本节课介绍监督学习,首要内容包含:
1. 序列决议计划问题的界说
2. 仿照学习:运用监督学习进行决议计划
3.(深度)仿照学习近期研讨事例剖析
4. 仿照学习的缺陷
了解监督学习界说和符号; 了解根底仿照学习算法; 了解仿照学习算法的优劣势。


本节课介绍强化学习,首要内容包含:
1. 马尔可夫决议计划进程的界说
2. 强化学习问题的界说
3. 强化学习算法解析
4. 扼要介绍强化学习算法类型
了解强化学习界说和符号; 了解强化学习的方针; 尽可能了解一切强化学习算法。

马尔可夫决议计划进程界说:



9 月 6 日:战略梯度简介(Levine)

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:service@qeerd.com,投稿邮箱:tougao@qeerd.com