您好,欢迎来到聚文网。 登录 免费注册
深度学习和大模型原理与实践/人工智能前沿实践丛书

深度学习和大模型原理与实践/人工智能前沿实践丛书

  • 字数: 480
  • 出版社: 清华大学
  • 作者: 常耀斌//王文惠|
  • 商品条码: 9787302675419
  • 适读年龄: 12+
  • 版次: 1
  • 开本: 16开
  • 页数: 349
  • 出版年份: 2024
  • 印次: 1
定价:¥119 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书是一本全面深入探 讨深度学习领域的核心原理 与应用实践的专业书籍。本 书旨在为读者提供系统的学 习路径,从深度学习的基础 知识出发,逐步深入到复杂 的大模型架构和算法实现。 本书适合深度学习初学者、 中级开发者以及对大模型有 深入研究需求的专业人士。 通过阅读本书,读者不仅能 够掌握深度学习的理论基础 ,还能通过丰富的实战案例 ,提升解决实际问题的能力 。
作者简介
常耀斌,资深大数据专家,拥有16年国家级项目架构设计与管理经验。北邮计算机工学硕士,曾就职于中国电科、华为、中国移动等知名企业,历任项目经理、高级专家、技术总监、高级架构师等职务。一直专注于亿级用户规模的大数据和人工智能平台的技术架构研发和关键技术研究,参与项目曾获“国家科技进步特等奖“,个人曾获“金牌员工”、“优秀共产党员”称号。个人拥有中国发明专利40多项,发表国家级期刊学术论文10多篇,多次应邀参加国内顶级会议和高峰论坛,并担任专家评委和评审专家。
目录
第1章 从机器学习到大模型 1.1 AI的两次技术革命 1.2 AI技术发展历程 1.3 机器学习是什么 1.4 机器学习有哪些分支 1.5 什么是强化学习 1.6 深度学习的核心思想 1.7 卷积神经网络 1.8 生成式AI是如何发展起来的 1.9 大语言模型 1.10 是否所有大语言模型都是生成式AI 1.11 大语言模型LLM能干什么 1.12 大语言模型的“大”是什么含义 1.13 大模型的核心技术 1.14 Transformer背后的黑科技 1.15 Transformer演变了哪些成功的模型 1.16 主流算法框架介绍 1.17 Transformer模型的应用 第2章 PyTorch编程基础 2.1 PyTorch的卓越历程 2.2 PyTorch的优点 2.3 PyTorch的使用场景 2.4 NumPy库的数组 2.4.1 创建数组 2.4.2 数组运算 2.4.3 索引 2.4.4 矩阵运算 2.5 tensor操作 2.6 GPU加速 2.7 自动求导 2.8 PyTorch神经网络 2.8.1 继承Module类来构造模型 2.8.2 Sequential类 2.8.3 ModuleList类 2.8.4 ModuleDict类 2.8.5 含模型参数的自定义层 2.9 构建神经网络 2.9.1 DataLoader介绍 2.9.2 自定义数据集 2.9.3 模型的保存和加载 2.10 使用GPU加速 2.10.1 Tensor在CPU和GPU之间转移 2.10.2 将模型转移到GPU上 2.10.3 使用torchvision进行图像操作 2.10.4 使用TensorBoard进行可视化 2.11 PyTorch实战案例 2.11.1 数据加载和预处理 2.11.2 定义网络模型 2.11.3 定义损失函数和优化器 2.11.4 训练网络 2.11.5 测试网络 2.11.6 保存和加载模型 第3章 卷积神经网络 3.1 神经网络结构 3.2 感知机 3.3 前馈神经网络 3.4 学习率 3.5 激活函数 3.6 深度学习 3.7 卷积神经网络详解 第4章 Transformer 4.1 Transformer原理 4.1.1 背景 4.1.2 模型架构 4.1.3 位置编码器 4.1.4 编码器 4.1.5 自注意力机制 4.1.6 多头自注意力 4.1.7 基于位置的前馈网络 4.1.8 残差连接和层规范化 4.1.9 整合代码 4.1.10 解码器 4.1.11 输出部分 4.1.12 整合代码 4.1.13 读取数据集 4.1.14 损失函数 4.1.15 模型训练 4.1.16 模型预测 4.1.17 模型应用 4.2 BERT介绍 4.2.1 BERT架构 4.2.2 预训练任务 4.2.3 掩蔽语言模型 4.2.4 下一个句子预测 4.2.5 整合代码 4.2.6 损失函数 4.2.7 微调任务 4.3 其他预训练模型 4.3.1 模型应用之一:自然语言处理 4.3.2 模型应用之二:语音识别 4.3.3 模型应用之三:计算机视觉 第5章 基于深度学习的推荐 5.1 基于行为的协同过滤 5.2 基于深度学习的推荐 5.3 基于Pytorch的 DeepFM的完整实战代码 5.4 模型训练代码实战 第6章 YOLO目标检测 6.1 什么是YOLO 6.2 YOLO V1 6.2.1 YOLO V1工作流程 6.2.2 网络结构 6.2.3 损失函数 6.2.4 预测 6.2.5 优点及局限性 6.3 YOLO V2 6.3.1 YOLO V2的改进点 6.3.2 YOLO V2网络结构 6.3.3 YOLO V2训练策略 6.4 YOLO V3 6.4.1 主干网络 6.4.2 多尺度预测 6.5 YOLO V4 6.5.1 网络结构 6.5.2 优化策略 6.6 YOLO V5 6.7 YOLO V8 第7章 人脸识别应用 7.1 应用场景介绍 7.2 人脸识别系统架构 7.3 人脸检测模型:RetinaFace 7.3.1 模型 7.3.2 主干网络 7.3.3 特征金字塔网络 7.3.4 上下文信息模块 7.3.5 多检测头模块 7.3.6 锚框 7.4 训练模型 7.4.1 数据集 7.4.2 图像增广 7.4.3 损失函数 7.5 预测目标 7.5.1 偏移量解码器 7.5.2 非极大值抑制 7.5.3 模型预测 7.5.4 人脸对齐 7.6 人脸识别模型ArcFace 7.6.1 Softmax损失函数 7.6.2 Triplet损失函数 7.6.3 ArcFace损失函数 7.7 应用实战 第8章 Swin Transformer视觉大模型详解 8.1 Vision Transformer如何工作 8.2 第一代CV大模型Vision Transformer 8.3 ViT模型架构 8.4 第二代CV大模型Swin Transformer 8.5 核心代码讲解 第9章 地图智能搜索算法应用 9.1 产品介绍 9.2 文本匹配任务 9.3 ERNIE简介 9.4 深度语义召回 9.5 深度语义相关性 第10章 AI大模型与ChatGPT 10.1 大模型发展的驱动力 10.2 语言模型的定义及作用 10.3 语言模型的发展历程 10.4 ChatGPT是什么 10.5 预训练ChatGPT的步骤 10.6 ChatGPT模型的基本原理

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网