您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
深度强化学习理论与实践/计算机技术开发与应用丛书
字数: 520
出版社: 清华大学
作者: 编者:龙强//章胜|责编:赵佳霓
商品条码: 9787302625544
版次: 1
开本: 16开
页数: 355
出版年份: 2023
印次: 1
定价:
¥89
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书比较全面、系统地 介绍了深度强化学习的理论 和算法,并配有大量的案例 和编程实现的代码。全书核 心内容可以分为3部分,第 一部分为经典强化学习,包 括第2~4章,主要内容有动 态规划法、蒙特卡罗法、时 序差分法;第二部分为深度 强化学习,包括第6~8章, 主要内容有值函数近似算法 、策略梯度算法、策略梯度 法进阶;第三部分重点介绍 深度强化学习的经典应用案 例——AlphaGo系列算法。 另外,作为理论和算法的辅 助,第1章介绍强化学习的 模型,第5章简单介绍深度 学习和PyTorch。 本书对理论、模型和算 法的描述比较数学化,笔者 力求做到用严谨、清晰、简 洁的数学语言来写作;几乎 每个算法配有一个或多个测 试案例,便于读者理解理论 和算法;每个案例都配有编 程实现的代码,便于读者理 论联系实际,并亲自上手实 践。为降低读者编写代码的 难度,本书所有案例的代码 都是可以独立运行的,并且 尽量减少了对依赖包的使用 。 本书可以作为理工科相 关专业研究生的学位课教材 ,也可以作为人工智能、机 器学习相关专业高年级本科 生的选修课教材,还可以作 为相关领域学术研究人员、 教师和工程技术人员的参考 资料。
目录
第1章 强化学习的模型 1.1 强化学习简介 1.1.1 初识强化学习 1.1.2 强化学习的历史 1.1.3 强化学习与机器学习的关系 1.2 强化学习的模型 1.2.1 强化学习基本模型和要素 1.2.2 强化学习的执行过程 1.2.3 强化学习的数学模型——马尔可夫决策过程 1.2.4 环境模型案例 1.3 Gym介绍 1.3.1 Gym简介 1.3.2 Gym安装 1.3.3 Gym的环境描述和案例 1.3.4 在Gym中添加自编环境 1.3.5 直接使用自编环境 第2章 动态规划法 2.1 动态规划法简介 2.2 值函数和贝尔曼方程 2.2.1 累积折扣奖励 2.2.2 值函数 2.2.3 贝尔曼方程 2.3 策略评估 2.4 策略改进 2.5 最优值函数和最优策略 2.6 策略迭代和值迭代 2.7 动态规划法求解强化学习案例 第3章 蒙特卡罗法 3.1 蒙特卡罗法简介 3.2 蒙特卡罗策略评估 3.2.1 蒙特卡罗策略评估 3.2.2 增量式蒙特卡罗策略评估 3.2.3 蒙特卡罗策略评估案例 3.2.4 蒙特卡罗和动态规划策略评估的对比 3.3 蒙特卡罗强化学习 3.3.1 蒙特卡罗策略改进 3.3.2 起始探索蒙特卡罗强化学习 3.3.3 贪婪策略蒙特卡罗强化学习 3.3.4 蒙特卡罗强化学习案例 3.4 异策略蒙特卡罗强化学习 3.4.1 重要性采样 3.4.2 异策略蒙特卡罗策略评估 3.4.3 增量式异策略蒙特卡罗策略评估 3.4.4 异策略蒙特卡罗强化学习 3.4.5 异策略蒙特卡罗强化学习案例 3.5 .蒙特卡罗树搜索 3.5.1 MCTS的基本思想 3.5.2 MCTS的算法流程 3.5.3 基于MCTS的强化学习算法 3.5.4 案例和代码
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网