您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
基于模型的强化学习
字数: 329
出版社: 东南大学
作者: (伊朗)米拉德·法尔西//刘俊|译者:高艺//夏宇翔//陈锋//刘攀成//钟家华等
商品条码: 9787576610444
版次: 1
开本: 16开
页数: 236
出版年份: 2024
印次: 1
定价:
¥98
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
强化学习是机器学习的一个基本范示,其中智 能体执行动作以确保设备的最优性能。虽然这种机 器学习范式近年来取得了巨大的成功和普及,但以 前的学术研究要么集中在理论上——最优控制和动 态规划——要么集中在算法上——其中大多数是基 于仿真的。 《基于模型的强化学习》提供了一个基于模型 的框架来桥接这两个方面,从而创建了一个基于模 型的在线学习控制主题的整体处理。在此过程中, 作者寻求开发一个基于模型的数据驱动控制框架, 该框架将数据系统识别、基于模型的强化学习和最 优控制以及每个主题的应用连接起来。这种评估经 典结果的新技术将会是更有效的强化学习系统。本 书的核心是提供一个端到端的框架——从设计到应 用——一种更易于处理的基于模型的强化学习技术 。 基于模型的强化学习的读者还会发现: 这是一本实用的教科书,适用于数据驱动和基 于学习的控制研究生课程中,强调从数据对动态系 统进行建模和控制。 详细比较了不同技术的影响,如基本线性二次 型控制器、基于学习的模型预测控制、无模型强化 学习和结构化在线学习。 非完整动力学的地面车辆应用与实例研究,以 及在四旋翼直升机上的应用与实例研究。 一个基于Python的在线工具箱,该工具箱包含 本书所涵盖的内容以及必要的代码和数据。 《基于模型的强化学习》是高年级本科生、研 究生、研究助理、教授、过程控制工程师和机器人 专家的有用参考书籍。
目录
前言 1 非线性系统分析 1.1 符号 1.2 非线性动态系统 1.3 Lyapunov稳定性分析 1.4 离散时间动态系统的稳定性分析 1.5 总结 参考文献 2 优化控制 2.1 问题描述 2.2 动态规划 2.3 线性二次型调节器 2.4 总结 参考文献 3 强化学习 3.1 具有二次成本的控制仿射系统 3.2 精确策略迭代 3.3 未知动力学和函数逼近的策略迭代 3.4 总结 参考文献 4 动态模型的学习 4.1 简介 4.2 模型选择 4.3 参数模型 4.4 参数化学习算法 4.5 持续激励 4.6 Python工具箱 4.7 对比结果 4.8 总结 参考文献 5 基于结构化在线学习的连续时间非线性系统控制 5.1 简介 5.2 结构化近似最优控制框架 5.3 局部稳定性与最优性分析 5.4 SOL算法 5.5 仿真结果 5.6 小结 参考文献 6 结构化在线学习方法在未知动态非线性跟踪中的应用 6.1 简介 6.2 跟踪控制的结构化在线学习 6.3 使用SOL的基于学习的跟踪控制 6.4 仿真结果 6.5 总结 参考文献 7 分段学习与控制及其稳定性保证 7.1 简介 7.2 问题公式化描述 7.3 分段学习与控制框架 7.4 不确定性边界分析 7.5 分段仿射学习与控制的稳定性验证 7.6 数值结果 7.7 总结 参考文献 8 太阳能光伏系统应用 8.1 简介 8.2 问题描述 8.3 光伏阵列的最优控制 8.4 应用注意事项 8.5 仿真结果 8.6 总结 参考文献 9 四旋翼无人机低级控制应用 9.1 简介 9.2 四旋翼无人机模型 9.3 基于RLS识别器的四旋翼无人机结构化在线学习 9.4 数值结果 9.5 总结 参考文献 10 Python工具箱 10.1 概述 10.2 用户输入 10.3 SOL 10.4 显示与输出 10.5 总结 参考文献 附录 A.1 注释5.4的补充分析 A.2 注释5.5的补充分析
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网