您好,欢迎来到聚文网。 登录 免费注册
MindSpore大语言模型实战

MindSpore大语言模型实战

华为昇思官方推荐,人工智能领域陈雷教授力作,详细介绍MindSpore在大模型领域的应用,提供丰富的实战案例和代码示例。
  • 字数: 160000
  • 装帧: 平装
  • 出版社: 人民邮电出版社
  • 作者: 陈雷 编
  • 出版日期: 2024-10-01
  • 商品条码: 9787115644404
  • 版次: 1
  • 开本: 16开
  • 页数: 176
  • 出版年份: 2024
定价:¥59.8 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
1、本书以MindSpore人工智能框架在大语言模型领域的应用为主要内容,详尽阐述了MindSpore框架在大语言模型中的应用。 2、无论是开发者、从业者还是学生,希望能够快速理解并构建大模型,本书以实践为主,能够帮助开发者快速理解并打造自己的大模型。 3、本书强调实战应用,提供了丰富的实战案例和代码示例,助力读者在实践中掌握构建和优化大语言模型的关键技术。
内容简介
随着ChatGPT等大语言模型的迅速发展,大语言模型已经成为人工智能领域发展的快车道,不同领域涌现出各种强大的新模型。开发者想要独立构建、部署符合自身需求的大语言模型,需要理解大语言模型的实现框架和基本原理。
本书梳理大语言模型的发展,首先介绍Transformer模型的基本原理、结构和模块及在NLP任务中的应用;然后介绍由只编码(Encoder-Only)到只解码(Decoder-Only)的技术路线发展过程中对应的 BERT、GPT等大语言模型;接下来介绍大语言模型在部署、训练、调优过程中涉及的各种关键技术,如自动并行、预训练与微调、RLHF等,并提供相应的实践指导;最后以开源大语言模型BLOOM和LLaMA为样例,介绍其架构和实现过程,帮助读者理解并构建、部署自己的大语言模型。本书还提供了基于MindSpore框架的丰富样例代码。
本书适合人工智能、智能科学与技术、计算机科学与技术、电子信息工程、自动化等专业的本科生和研究生阅读,同时也为从事大语言模型相关工作的软件开发工程师和科研人员提供翔实的参考资料。
作者简介
陈雷 加拿大滑铁卢大学计算机博士。现担任香港科技大学(广州)信息枢纽院长,数据科学与分析学域讲座教授,广州市大数据智能重点实验室主任。研究方向包括数据驱动的人工智能、大数据分析、知识图谱、众包、区块链、图数据库、概率和不确定数据库,以及时空和时间序列数据库。曾获2020年度中国电子学会科学技术奖一等奖、2015年ACM SIGMOD时间检测奖2022 WLDB研究论文奖、2014LDB示范奖。曾担任ICDE2023和VLDB2019 PC联合主席、VLDB Journal联合主编、VLDB基金会执行委员。目前担任IEEETKDE主编、DASFAA国际会议指导委员会主席、长江讲座教授,当选IEEE会士和ACM杰出科学家,获得国家杰出青年科学基金海外青年学者合作研究项目支持。
目录
第1章大语言模型的发展001
1.1人工智能的发展阶段002
1.2从深度学习到大语言模型004
第2章Transformer模型006
2.1Transformer模型的基本原理007
2.1.1注意力机制007
2.1.2自注意力机制010
2.1.3多头注意力机制011
2.2Transformer模型的结构和模块013
2.2.1位置编码014
2.2.2编码器016
2.2.3解码器020
2.2.4模型代码024
2.3Transformer模型在NLP任务中的应用025
2.4使用MindSpore实现基于Transformer模型的文本机器翻译模型026
2.4.1数据集准备与数据预处理026
2.4.2模型构建033
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网