您好,欢迎来到聚文网。 登录 免费注册
大模型应用开发

大模型应用开发

  • 字数: 341
  • 出版社: 机械工业
  • 作者: 于俊//程礼磊//程明月|
  • 商品条码: 9787111769750
  • 版次: 1
  • 开本: 16开
  • 页数: 244
  • 出版年份: 2025
  • 印次: 1
定价:¥99 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书由科大讯飞与中国科大的大模型的资深专家联合撰写,一本书打通大模型的技术原理与应用实践壁垒,深入大模型3步工作流程,详解模型微调、对齐优化、提示工程等核心技术及不同场景的微调方案,全流程讲解6个典型场景的应用开发实践。 本书共10章,从逻辑上分为“基础知识”“原理与技术”“应用开发实践”三部分。基础知识(第1章)介绍大模型定义、应用现状、存在的问题,以及发展趋势。原理与技术(第2和3章)详细讲解大模型的构建流程、Transformer模型,以及模型微调、对齐优化、提示工程等核心技术,之后介绍了推理优化、大模型训练、大模型评估、大模型部署等拓展技术。应用开发实践(第4~10章)详细讲解大模型插件应用开发、RAG实践,以及智能客服问答、学科知识问答、法律领域应用、医疗领域应用、智能助写平台等多领域的实践。
作者简介
于俊:科大讯飞高级人工智能工程师、中国科学技术大学工程博士、CCF高级会员。主要研究数据挖掘、知识图谱、认知智能创新探索及应用,拥有超过15年的大数据及人工智能算法工程化经验。参与编写了《Spark核心技术与高级应用》《Spark机器学习进阶实战》《知识图谱实战:构建方法与行业应用》《人工智能数据处理基础》等著作。<br />程礼磊:科大讯飞实验室产品部算法总监、合肥工业大学概率论与数理统计硕士。在数据分析与挖掘、自然语言处理、教育认知诊断等领域有丰富的研究和开发经验,精通Python、R语言以及人工智能深度学习框架,在人工智能教育、产教融合行业应用有着诸多落地经验。<br />程明月:中国科学技术大学计算机科学与技术学院特任副研究员、硕士生导师、工学博士。主要研究时序建模、大模型方法及其应用,同时担任中国中文信息学会信息检索专委会通讯委员、中国老年学与老年医学学会慢病远程与智能管理分会委员。在相关领域国际学术会议和重要期刊上发表学术论文20余篇,申请发明专利10余项。担任多个国际学术期刊与会议(如IEEE TKDE、SIGKDD、SIGIR等)的审稿人,以及程序委员会委员。曾荣获多项算法竞赛与双创赛事竞赛奖励,包括KDD Cup 2024全球亚军等。<br />程礼磊:科大讯飞实验室产品部算法总监、合肥工业大学概率论与数理统计硕士。在数据分析与挖掘、自然语言处理、教育认知诊断等领域有丰富的研究和开发经验,精通Python、R语言以及人工智能深度学习框架,在人工智能教育、产教融合行业应用有着诸多落地经验。<br />程明月:中国科学技术大学计算机科学与技术学院特任副研究员、硕士生导师、工学博士。主要研究时序建模、大模型方法及其应用,同时担任中国中文信息学会信息检索专委会通讯委员、中国老年学与老年医学学会慢病远程与智能管理分会委员。在相关领域国际学术会议和重要期刊上发表学术论文20余篇,申请发明专利10余项。担任多个国际学术期刊与会议(如IEEE TKDE、SIGKDD、SIGIR等)的审稿人,以及程序委员会委员。曾荣获多项算法竞赛与双创赛事竞赛奖励,包括KDD Cup 2024全球亚军等。
目录
目  录<br />前言<br />第1章 大模型概述 / 1<br />1.1 大模型的概念 / 1<br />1.2 大模型的应用现状 / 4<br />1.2.1 国外的大模型 / 4<br />1.2.2 国内的大模型 / 7<br />1.2.3 大模型的应用情况 / 9<br />1.3 大模型存在的问题 / 10<br />1.3.1 机器幻觉 / 11<br />1.3.2 安全伦理 / 12<br />1.3.3 选择错误目标 / 13<br />1.3.4 难以监督 / 14<br />1.4 大模型的发展趋势 / 14<br />1.4.1 多模态能力 / 14<br />1.4.2 AI Agent / 15<br />1.4.3 端侧应用 / 15<br />1.4.4 可信任性及可解释性 / 16<br />1.4.5 自我学习 / 16<br />1.5 本章小结 / 17<br />第2章 大模型核心技术 / 18<br />2.1 大模型构建流程 / 18<br />2.1.1 预训练语言模型 / 20<br />2.1.2 模型微调 / 22<br />2.1.3 对齐优化 / 24<br />2.2 Transformer模型 / 25<br />2.2.1 Transformer模型概述 / 25<br />2.2.2 编码器与解码器 / 28<br />2.2.3 注意力机制 / 32<br />2.2.4 词向量 / 36<br />2.2.5 位置编码 / 37<br />2.2.6 规范化 / 40<br />2.2.7 激活函数 / 41<br />2.2.8 优化器 / 41<br />2.2.9 基于Transformer的大模型架构选择 / 42<br />2.3 模型微调 / 43<br />2.3.1 指令微调数据集 / 43<br />2.3.2 调优策略 / 46<br />2.4 对齐优化 / 60<br />2.4.1 反馈 / 60<br />2.4.2 偏好模型 / 61<br />2.4.3 RLHF / 62<br />2.5 提示工程 / 64<br />2.5.1 提示工程开发流程 / 65<br />2.5.2 提示设计开发 / 66<br />2.6 本章小结 / 73<br />第3章 大模型技术拓展 / 74<br />3.1 推理优化技术 / 74<br />3.1.1 解码优化算法 / 74<br />3.1.2 推理加速策略 / 78<br />3.2 大模型训练技术 / 81<br />3.2.1 并行训练 / 81<br />3.2.2 训练容错 / 87<br />3.2.3 混合精度训练 / 89<br />3.3 大模型评估 / 91<br />3.3.1 大模型评估概述 / 91<br />3.3.2 大模型评估任务 / 91<br />3.3.3 大模型评估数据集 / 91<br />3.3.4 大模型评估方法 / 93<br />3.4 大模型部署 / 96<br />3.4.1 模型环境搭建 / 96<br />3.4.2 模型运行测试 / 97<br />3.5 本章小结 / 99<br />第4章 插件应用开发实践 / 100<br />4.1 应用概述 / 100<br />4.1.1 ChatGPT插件 / 100<br />4.1.2 LangChain插件 / 101<br />4.1.3 通用插件调用流程 / 103<br />4.2 天气查询插件开发 / 103<br />4.2.1 基于ChatGPT的插件<br />开发 / 103<br />4.2.2 基于AutoGen的插件<br />开发 / 110<br />4.3 语音交互插件开发 / 114<br />4.4 本章小结 / 118<br />第5章 RAG实践 / 119<br />5.1 应用概述 / 119<br />5.2 RAG流程 / 120<br />5.3 环境构建 / 121<br />5.4 应用实践 / 122<br />5.4.1 知识解析 / 123<br />5.4.2 检索 / 127<br />5.4.3 增强 / 130<br />5.4.4 生成 / 134<br />5.5 本章小结 / 135<br />第6章 智能客服问答实践 / 136<br />6.1 应用概述 / 136<br />6.2 环境构建 / 137<br />6.2.1 开发环境搭建 / 137<br />6.2.2 开源模型下载 / 138<br />6.3 应用开发 / 139<br />6.3.1 实现多轮对话系统 / 139<br />6.3.2 提示优化 / 141<br />6.3.3 第三方工具调用 / 150<br />6.4 应用部署 / 152<br />6.5 本章小结 / 154<br />第7章 学科知识问答实践 / 155<br />7.1 应用概述 / 155<br />7.2 环境构建 / 155<br />7.2.1 开发环境搭建 / 156<br />7.2.2 项目参数配置 / 156<br />7.3 学科知识图谱 / 158<br />7.3.1 大模型与知识图谱 / 158<br />7.3.2 学科知识图谱构建流程 / 159<br />7.3.3 学科知识数据集 / 161<br />7.3.4 学科知识处理 / 162<br />7.4 应用开发 / 164<br />7.4.1 功能设置 / 164<br />7.4.2 知识库构建 / 165<br />7.4.3 基于LangChain的问答<br />实践 / 167<br />7.5 本章小结 / 170<br />第8章 法律领域应用实践 / 171<br />8.1 应用概述 / 171<br />8.2 对话数据微调 / 172<br />8.2.1 法律对话数据预处理 / 172<br />8.2.2 对话微调工具编写 / 175<br />8.2.3 模型微调框架的参数配置 / 176<br />8.2.4 微调前后的对话问答<br />对比 / 179<br />8.3 指令微调 / 181<br />8.3.1 法律指令数据集预处理 / 181<br />8.3.2 指令微调工具编写 / 182<br />8.3.3 法律大模型指令问答<br />评估 / 186<br />8.3.4 微调前后的对话问答<br />对比 / 189<br />8.4 部署验证 / 191<br />8.5 本章小结 / 193<br />第9章 医疗领域应用实践 / 194<br />9.1 应用概述 / 194<br />9.2 医疗数据集构建 / 195<br />9.2.1 增量预训练数据集 / 195<br />9.2.2 有监督微调数据集 / 195<br />9.2.3 直接偏好优化数据集 / 196<br />9.2.4 模型评测数据集 / 196<br />9.3 增量预训练与微调 / 198<br />9.3.1 增量预训练 / 198<br />9.3.2 有监督微调 / 205<br />9.3.3 直接偏好优化 / 208<br />9.4 部署验证 / 211<br />9.5 模型评估 / 213<br />9.5.1 配置评估任务 / 213<br />9.5.2 启动评估任务 / 214<br />9.5.3 可视化评估结果 / 215<br />9.6 本章小结 / 216<br />第10章 智能助写平台实践 / 217<br />10.1 应用概述 / 217<br />10.2 业务逻辑 / 218<br />10.2.1 系统总体设计 / 218<br />10.2.2 模块设计 / 218<br />10.3 功能实现 / 219<br />10.3.1 写作润色功能 / 219<br />10.3.2 批阅纠错功能 / 223<br />10.3.3 智能翻译功能 / 227<br />10.3.4 个人中心功能 / 229<br />10.4 本章小结 / 231<br />附录 大模型的发展阶段 / 232

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网