用Python动手学强化学习(改订第2版)--聚文网

精选

¥5.83

世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版

¥5.39

正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册

¥8.58

简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版

¥5.83

世界文学名著全49册中小学生青少年课外书籍文学小说批发正版

¥4.95

全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷

¥8.69

父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册

¥24.2

好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册

¥7.15

幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书

¥11.55

用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书

¥19.8

少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版

¥64

科学真好玩

¥12.7

一年级下4册·读读童谣和儿歌

¥38.4

原生态新生代(传统木版年画的当代传承国际研讨会论文集)

¥11.14

法国经典中篇小说

¥11.32

上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)

¥22.05

猫的摇篮(精)

¥30.72

幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书

旧时风物(精)

三希堂三帖/墨林珍赏

寒山子庞居士诗帖/墨林珍赏

苕溪帖/墨林珍赏

楷书王维诗卷/墨林珍赏

兰亭序/墨林珍赏

祭侄文稿/墨林珍赏

蜀素帖/墨林珍赏

真草千字文/墨林珍赏

进宴仪轨(精)/中国古代舞乐域外图书

舞蹈音乐的基础理论与应用

编辑推荐

1.从基础到应用，一本书快速入门强化学习 2.基于Python实现强化学习，直观理解运作过程 3.内容丰富，涵盖强化学习基本概念、算法详解、前沿应用、弱点及对策 4.132张图表与大量示例，全彩印刷图文并茂提供良好阅读体验 5.附免费下载源代码为读者提供亲身实践机会

内容简介

强化学习是机器学习的重要分支之一。本书结合实际可运行的Python代码，通过简明的文字、丰富的插图和示例，通俗易懂地介绍了从基础概念到前沿应用等方方面面的内容，包括根据环境和经验制订计划的学习方法、强化学习与神经网络的组合，以及强化学习的弱点和克服方法。读者通过下载书中代码并亲自动手运行，可以快速入门强化学习并进行实践。本书适合具有一定编程经验、对强化学习感兴趣的工程师阅读。

第1章了解强化学习
1.1 强化学习与各关键词之间的关系
1.2 强化学习的优点和弱点
1.3 强化学习的问题设定：马尔可夫决策过程
第2章强化学习的解法（1）：根据环境制订计划
2.1 价值的定义和计算：贝尔曼方程
2.2 基于动态规划法的价值近似的学习：价值迭代
2.3 基于动态规划法的策略的学习：策略迭代
2.4 基于模型的方法和无模型的方法的区别
第3章强化学习的解法（2）：根据经验制订计划
3.1 平衡经验的积累与利用：Epsilon-Greedy算法
3.2 是根据实际奖励还是预测来修正计划：蒙特卡洛方法和时序差分学习
3.3 用经验来更新价值近似还是策略：基于价值和基于策略
第4章使用面向强化学习的神经网络
4.1 将神经网络应用于强化学习
4.2 通过含有参数的函数实现价值近似：价值函数近似
4.3 将深度学习应用于价值近似：DQN
4.4 通过含有参数的函数实现策略：策略梯度
4.5 将深度学习应用于策略：A2C
4.6 是价值近似还是策略呢
第5章强化学习的弱点
5.1 获取样本的效率低
5.2 容易陷入局部很优行动和过拟合
5.3 复现性差
5.4 以弱点为前提的对策
第6章克服强化学习弱点的方法
6.1 应对采样效率低的方法：与基于模型的方法一起使用、表征学习
6.2 改善复现性的方法：进化策略
6.3 应对局部很优行动和过拟合的方法：模仿学习和逆强化学习
第7章强化学习的应用领域
7.1 行动的很优化
7.2 学习的很优化
参考文献

用Python动手学强化学习(改订第2版)

库存： {{selectedSku?.stock}} 库存充足

上架到店铺