深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书--聚文网

精选

¥5.83

世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版

¥5.39

正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册

¥8.58

简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版

¥5.83

世界文学名著全49册中小学生青少年课外书籍文学小说批发正版

¥4.95

全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷

¥8.69

父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册

¥24.2

好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册

¥7.15

幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书

¥11.55

用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书

¥19.8

少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版

¥64

科学真好玩

¥12.7

一年级下4册·读读童谣和儿歌

¥38.4

原生态新生代(传统木版年画的当代传承国际研讨会论文集)

¥11.14

法国经典中篇小说

¥11.32

上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)

¥21.56

猫的摇篮(精)

¥30.72

幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书

旧时风物(精)

三希堂三帖/墨林珍赏

寒山子庞居士诗帖/墨林珍赏

苕溪帖/墨林珍赏

楷书王维诗卷/墨林珍赏

兰亭序/墨林珍赏

祭侄文稿/墨林珍赏

蜀素帖/墨林珍赏

真草千字文/墨林珍赏

进宴仪轨(精)/中国古代舞乐域外图书

舞蹈音乐的基础理论与应用

内容简介

围绕着MDP模型，阐述动态规划、蒙特卡罗、动态规划等有穷表格式强化学习方法。在深度强化学习框架 PyTorch下，阐述 DQN,DDDPG,A3C等算法。本书以实例为导向，深度浅出地讲解相关算法。全书采用完整的数学体系，各章内容循序渐进，严谨地讲授强化学习的理论基础，主要定理均给出证明过程。基于理论讲解强化学习算法，覆盖了所有主流强化学习算法，包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。适合本科以上的人工智能相关专业学生及工程人员。

作者简介

\\\"刘全，苏州大学教授，博士生导师。吉林大学博士, 南京大学软件新技术国家重点实验室博士后。苏州市人工智能学会常务理事、秘书长。2006年开始从事强化学习领域的教学和科研工作。主讲研究生、本科生《强化学习》及相关课程16次。主持“深度强化学习方法研究”、“部分感知强化学习理论及方法”、“基于tableau的逻辑强化学习研究”等国家、省部级项目10余项。目前主要研究方向为：深度强化学习。 2012年获江苏省教工委优秀共产党员称号。2011年、2012年入选江苏省“六大人才”、江苏省“333”人才培养计划。\\\"

第一部分：预备知识及环境安装第1章深度强化学习概述 1.1 引言 1.2 深度学习 1.3 强化学习 1.4 深度强化学习 1.5 小结 1.6 习题第2章环境的配置 2.1 PyTorch简介 2.2 PvTorch和TensorFlow 2.3 强化学习的开发环境 2.3.1 Anaconda环境搭建 2.3.2 Anaconda环境管理 2.3.3 PyTorch的安装 2.3.4 Jupyter Notebook的安装 2.3.5 Jupyter Notebook的使用 2.3.6 Gym的安装 2.3.7 Gym案例 2.4 小结 2.5 习题第二部分：表格式强化学习第3章数学建模 3.1 马尔可夫决策过程 3.2 基于模型与无模型 3.3 求解强化学习任务 3.3.1 策略 3.3.2 奖赏与回报 3.3.3 值函数与贝尔曼方程 3.3.4 最优策略与最优值函数 3.4 探索与利用 3.5 小结 3.6 习题第4章动态规划法 4.1 策略迭代 4.1.1 策略评估 4.1.2 策略迭代 4.2 值迭代 4.3 广义策略迭代 4.4 小结 4.5 习题第5章蒙特卡洛法 5.1 蒙特卡洛法的基本概念 5.1.1 MC的核心要素 5.1.2 MC的特点 5.2 蒙特卡洛预测 5.3 蒙特卡洛评估 5.4 蒙特卡洛控制 5.4.1 基于探索始点的蒙特卡洛控制 5.4.2 同策略蒙特卡洛控制

深度强化学习(原理算法与PyTorch实战微课视频版)/大数据与人工智能技术丛书

库存： {{selectedSku?.stock}} 库存充足