您好,欢迎来到聚文网。 登录 免费注册
深度强化学习实践(影印版)(英文版)

深度强化学习实践(影印版)(英文版)

  • 字数: 670
  • 出版社: 东南大学
  • 作者: (俄罗斯)马克西姆·拉潘
  • 商品条码: 9787564183219
  • 版次: 1
  • 开本: 16开
  • 页数: 523
  • 出版年份: 2019
  • 印次: 1
定价:¥109 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
强化学习(RL)的最新发展结合深度学习(DL),在 训练代理以类似人的方式解决复杂问题方面取得了前 所未有的进步。Google使用算法在著名的Atari街机游 戏中获胜将该领域推至高峰,研究人员也在源源不断 地产生新的想法。 本书是关于最新DL工具及其局限性的全面指南。 在应用于真实环境之前,你得评估包括交叉熵和策略 梯度在内的多种方法。试试Atari的虚拟游戏和像 connect4这样的家庭最爱。本书介绍了RL的基础知识 ,为你提供了编写智能学习代理所需的原理,以承担 一系列艰巨的实际任务。让你了解如何在“网格世界 ”环境中实现Q-learning,教你的代理购买和交易股 票,发现自然语言模型如何推动了聊天机器人的火爆 。
目录
Preface Chapter 1: What is Reinforcement Learning? Learning - supervised, unsupervised, and reinforcement RL formalisms and relations Reward The agent The environment Actions Observations Markov decision processes Markov process Markov reward process Markov decision process Summary Chapter 2: OpenAI Gym The anatomy of the agent Hardware and software requirements OpenAI Gym API Action space Observation space The environment Creation of the environment The CartPole session The random CartPole agent The extra Gym functionality - wrappers and monitors Wrappers Monitor Summary Chapter 3: Deep Learning with PyTorch Tensors Creation of tensors Scalar tensors Tensor operations GPU tensors Gradients Tensors and gradients NN building blocks Custom layers Final glue - loss functions and optimizers Loss functions Optimizers Monitoring with TensorBoard TensorBoard 101 Plotting stuff Example -GAN on Atari images Summary Chapter 4: The Cross-Entropy Method Taxonomy of RL methods Practical cross-entropy Cross-entropy on CartPole

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网