您好,欢迎来到聚文网。 登录 免费注册
大语言模型原理、训练及应用 基于GPT

大语言模型原理、训练及应用 基于GPT

  • 字数: 479000
  • 装帧: 平装
  • 出版社: 机械工业出版社
  • 作者: 魏新宇,白雪冰,周博洋 编
  • 出版日期: 2024-09-01
  • 商品条码: 9787111762355
  • 版次: 1
  • 开本: 16开
  • 页数: 280
  • 出版年份: 2024
定价:¥99 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
微软中国区总裁 原欣 红帽全球副总裁兼大中华区总裁 曹衡康 微软中国区首席技术官 韦青 NVIDIA电信行业总监 贾楠 联袂推荐 系统总结LLM/SLM和Copilot端到端的开发经验,全面归纳GPU训练推理实战方法,面向AI架构师及开发者的实用技术指南
内容简介
   本书是一本系统介绍大语言模型原理、训练及应用的书,共7章,主要内容包括:认识大语言模型、大语言模型训练、GPU池化——构建大语言模型算力基础、GPT的优化与编排、GPT应用开发实践、Copilot应用开发实践、语言模型小型化及在边缘端的部署。本书详尽阐述了大语言模型的起源、定义及其与传统深度学习方法间的关键差异,深入探讨了主流训练框架如何为大语言模型提供动力,并介绍了优化策略以及高效建立算力基础设施所要考虑的因素。内容涵盖从基础概念介绍到复杂系统编排,再到具体行业应用与开发等多个层面。

本书适合从事大语言模型开发及应用的读者参考,无论初学者还是经验丰富的实践者,都能从本书中学到实用的知识和技能。
目录
推荐序
前言
第1章 认识大语言模型
1.1大语言模型概述
1.1.1AI技术的发展
1.1.2生成式AI、NLP、GPT的关系
1.1.3大语言模型的发展
1.2大语言模型的训练
1.2.1预训练
1.2.2微调
1.2.3人类反馈强化学习
1.3大语言模型的核心应用场景
1.3.1内容创作
1.3.2摘要生成
1.3.3语义检索
1.3.4代码生成
1.4大语言模型的多模态场景
1.4.1文生图
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网