强化学习工程师深度实战课程 强化学习基础+进阶实战+核心算法+全域网络架构技术

强化学习工程师深度实战课程 强化学习基础+进阶实战+核心算法+全域网络架构技术

===============课程介绍===============
           强化学习,又称再励学习、评价学习或增强学习,是机器学习的范式和方之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
课程内容从强化学习的基础到进阶实战,每个阶段都有非常详细的指导和教学,可以很好的加深同学们对强化学习框架,网络流程,运行策略的理解,从宏观到细节,特别细致,对于想要快速在工作中运用强化学习的同学很有帮助。

===============课程目录===============
├─(1) 1-2 一张图通俗解释强化学习.mp4
├─(2) 1-3 强化学习的指导依据.mp4
├─(3) 1-4 强化学习AI游戏DEMO.mp4
├─(4) 1-5 应用领域简介.mp4
├─(5) 1-6 强化学习工作流程.mp4
├─(6) 1-7 计算机眼中的状态与行为.mp4
├─(7) 10-1 PyTorch框架发展趋势简介.mp4
├─(8) 10-2 框架安装方法(CPU与GPU版本).mp4
├─(9) 10-3 PyTorch基本操作简介.mp4
├─(10) 10-4 自动求导机制.mp4
├─(11) 10-5 线姓回归DEMO-数据与参数配置.mp4
├─(12) 10-6 线姓回归DEMO-训练回归模型.mp4
├─(13) 10-7 常见tensor格式.mp4
├─(14) 10-8 Hub模块简介.mp4
├─(15) 11-1 卷积网络参数定义.mp4
├─(16) 11-10 加载训练好的网络模型.mp4
├─(17) 11-11 优化器模块配置.mp4
├─(18) 11-12 实现训练模块.mp4
├─(19) 11-13 训练结果与模型保存.mp4
├─(20) 11-14 加载模型对测试数据进行预测.mp4
├─(21) 11-15 额外补充-Resnet论文解读.mp4
├─(22) 11-16 额外补充-Resnet网络架构解读.mp4
├─(23) 11-2 网络流程解读.mp4
├─(24) 11-3 Vision模块功能解读.mp4
├─(25) 11-4 分类任务数据集定义与配置.mp4
├─(26) 11-5 图像增强的作用.mp4
├─(27) 11-6 数据预处理与数据增强模块.mp4
├─(28) 11-7 Batch数据制作.mp4
├─(29) 11-8 迁移学习的目标.mp4
├─(30) 11-9 迁移学习策略.mp4
├─(31) 2-1 基本情况介绍.mp4
├─(32) 2-2 与环境交互得到所需数据.mp4
├─(33) 2-3 要完成的目标分析.mp4
├─(34) 2-4 策略梯度推导.mp4
├─(35) 2-5 baseline方法.mp4
├─(36) 2-6 OnPolicy与OffPolicy策略.mp4
├─(37) 2-7 importance sampling的作用.mp4
├─(38) 2-8 PPO算法整体思路解析.mp4
├─(39) 3-1 Critic的作用与效果.mp4
├─(40) 3-2 PPO2版本公式解读.mp4
├─(41) 3-3 参数与网络结构定义.mp4
├─(42) 3-4 得到动作结果.mp4
├─(43) 3-5 奖励获得与计算.mp4
├─(44) 3-6 参数迭代与更新.mp4
├─(45) 4-1 算法原理通俗解读.mp4
├─(46) 4-2 目标函数与公式解析.mp4
├─(47) 4-3 Qlearning算法实例解读.mp4
├─(48) 4-4 Q值迭代求解.mp4
├─(49) 4-5 DQN简介.mp4
├─(50) 5-1 整体任务流程演示.mp4
├─(51) 5-2 探索与action获取.mp4
├─(52) 5-3 计算target值.mp4
├─(53) 5-4 训练与更新.mp4
├─(54) 6-1 DoubleDqn要解决的问题.mp4
├─(55) 6-2 DuelingDqn改进方法.mp4
├─(56) 6-3 Dueling整体网络架构分析.mp4
├─(57) 6-4 MultiSetp策略.mp4
├─(58) 6-5 连续动作处理方法.mp4
├─(59) 7-1 AC算法回顾与知识点总结.mp4
├─(60) 7-2 优势函数解读与分析.mp4
├─(61) 7-3 计算流程实例.mp4
├─(62) 7-4 A3C整体架构分析.mp4
├─(63) 7-5 损失函数整理.mp4
├─(64) 8-1 整体流程与环境配置.mp4
├─(65) 8-2 启动游戏环境.mp4
├─(66) 8-3 初始化局部模型并加载参数.mp4
├─(67) 8-4 要计算的指标回顾.mp4
├─(68) 8-5 与环境交互得到训练数据.mp4
├─(69) 8-6 训练网络模型.mp4
├─(70) 9-1 卷积神经网络应用领域.mp4
├─(71) 9-10 VGG网络架构.mp4
├─(72) 9-11 残差网络Resnet.mp4
├─(73) 9-12 感受野的作用.mp4
├─(74) 9-2 卷积的作用.mp4
├─(75) 9-3 卷积特征值计算方法.mp4
├─(76) 9-4 得到特征图表示.mp4
├─(77) 9-5 步长与卷积核大小对结果的影响.mp4
├─(78) 9-6 边缘填充方法.mp4
├─(79) 9-7 特征图尺寸计算与参数共享.mp4
├─(80) 9-8 池化层的作用.mp4
├─(81) 9-9 整体网络架构.mp4
(1)课件;目录中文件数:7个
├─(82) 第一章:强化学习简介及其应用.pdf
├─(83) 第七章:Actor-Critic算法分析(A3C).pdf
├─(84) 第三章:策略梯度实战-月球登陆器训练实例.zip
├─(85) 第二章:PPO算法与公式推导.pdf
├─(86) 第五章:DQN算法实例演示.zip
├─(87) 第八章:A3C算法玩转超级马里奥.zip
├─(88) 第四章:DQN算法.pdf

免责声明: 1、本站信息来自网络,版权争议与本站无关 2、本站所有主题由该帖子作者发表,该帖子作者与本站享有帖子相关版权 3、其他单位或个人使用、转载或引用本文时必须同时征得该帖子作者和本站的同意 4、本帖部分内容转载自其它媒体,但并不代表本站赞同其观点和对其真实性负责 5、用户所发布的一切软件的解密分析文章仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。 6、您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。 7、请支持正版软件、得到更好的正版服务。 8、如有侵权请立即告知本站,本站将及时予与删除 9、本站所发布的一切破解补丁、注册机和注册信息及软件的解密分析文章和视频仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站信息来自网络,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。如有侵权请邮件与我们联系处理。
600学习网 » 强化学习工程师深度实战课程 强化学习基础+进阶实战+核心算法+全域网络架构技术