您好,欢迎来到聚文网。 登录 免费注册
RAG实践权威指南:构建精准、高效大模型之道

RAG实践权威指南:构建精准、高效大模型之道

  • 字数: 358
  • 出版社: 机械工业
  • 作者: 宁星星
  • 商品条码: 9787111781790
  • 适读年龄: 12+
  • 版次: 1
  • 开本: 16开
  • 页数: 256
  • 出版年份: 2025
  • 印次: 1
定价:¥89 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书由华大生命科学研究院资深NLP专家撰写,旨在带你从零构建高效的企业级RAG系统。本书全面解析RAG原理与实战,涵盖架构与组件、高阶技术与实践、检索与问答模块优化策略、模型推理等核心技术,并深入讲解三大落地优化技术,以及高阶变体与能力增强措施。 本书共8章。第1章介绍RAG技术基础,帮助读者建立对RAG技术的全面认知。第2章介绍RAG系统的核心组件与实践,帮助读者掌握核心技术与基于Python库的实践。第3章介绍高阶RAG技术与实践的细节,帮助读者掌握进阶技术。第4章介绍检索与问答模块的优化,全方位讲解优化策略。第5章介绍模型推理技术,加速RAG技术的落地。第6章介绍RAG系统在实际应用中的鲁棒性、安全性和公平性优化技术,提升RAG系统的整体性能与可信度。第7章介绍RAG技术的高阶变体,以充分挖掘RAG技术的应用潜力。第8章介绍实时知识更新与跨模态能力增强,展望RAG技术未来应用的方向。
作者简介
宁星星:华大生命科学研究院(BGI)生物智能研究所资深NLP算法工程师,目前从事RAG系统、Agent智能系统、生命科学垂直领域大模型等相关研发工作。拥有多年NLP算法相关开发经验,擅长大模型、AIGC、智能问答等相关技术,并多次获得全国性NLP与知识图谱相关竞赛奖项。著有《语义解析:自然语言生成SQL与知识图谱问答实战》一书。
目录
目  录<br />前言<br />第1章 RAG技术基础 / 1<br />1.1 为什么需要RAG技术 / 1<br />1.2 工作流程与核心技术解析 / 2<br />1.2.1 工作流程 / 2<br />1.2.2 核心技术 / 4<br />1.3 工作范式 / 6<br />1.4 价值与实际应用场景 / 8<br />1.5 计算资源与数据存储需求 / 9<br />1.5.1 计算资源的需求 / 10<br />1.5.2 数据存储的需求 / 11<br />1.6 面临的主要挑战 / 13<br />第2章 RAG系统的核心组件与<br />实践 / 16<br />2.1 向量数据库 / 16<br />2.1.1 Elasticsearch / 17<br />2.1.2 FAISS / 18<br />2.1.3 Milvus / 21<br />2.2 检索系统 / 26<br />2.2.1 基于知识图谱查询 / 26<br />2.2.2 基于关系型数据库查询 / 34<br />2.2.3 基于向量数据库查询 / 36<br />2.3 生成系统 / 42<br />2.3.1 Transformer / 42<br />2.3.2 GPT / 47<br />2.4 RAG系统基准测试工具 / 49<br />2.4.1 评测数据集 / 49<br />2.4.2 常用的评测基准与步骤 / 55<br />2.5 基于常用Python库的RAG<br />实践 / 64<br />2.5.1 基于Hugging Face Transformers库 / 64<br />2.5.2 基于PyTorch和<br />TensorFlow / 67<br />2.5.3 基于LlamaIndex / 69<br />2.5.4 基于LangChain / 71<br />第3章 高阶RAG技术与实践 / 75<br />3.1 切片与向量化技术 / 75<br />3.1.1 切片 / 75<br />3.1.2 向量化 / 77<br />3.1.3 向量存储与检索 / 78<br />3.1.4 优化切片与向量化策略 / 79<br />3.1.5 实战:从文本到向量 / 80<br />3.2 检索技术 / 82<br />3.2.1 检索流程及优化策略 / 82<br />3.2.2 关键词检索 / 88<br />3.2.3 语义检索 / 94<br />3.2.4 密集段落检索 / 99<br />3.2.5 混合检索 / 102<br />3.2.6 重排序 / 104<br />3.3 高级检索策略 / 112<br />3.3.1 假设性问题和假设性<br />回答策略 / 112<br />3.3.2 扩大检索语境 / 121<br />3.4 生成模型的选型与提示词工程 / 128<br />3.5 检索技术与生成技术的融合 / 131<br />3.5.1 RAG-Token模型 / 131<br />3.5.2 RAG-Sequence模型 / 132<br />第4章 检索与问答模块优化 / 134<br />4.1 数据预处理和管理优化 / 134<br />4.1.1 数据清洗 / 134<br />4.1.2 数据存储和访问优化 / 135<br />4.2 检索模块的优化 / 141<br />4.2.1 嵌入模型的训练优化 / 141<br />4.2.2 文档解析技术的优化 / 144<br />4.2.3 同义词扩展 / 149<br />4.2.4 查询重写 / 154<br />4.3 问答模块的优化 / 158<br />4.3.1 问答能力的优化 / 158<br />4.3.2 增强拒答能力 / 168<br />第5章 模型推理优化 / 175<br />5.1 推理加速技术 / 175<br />5.1.1 量化 / 175<br />5.1.2 剪枝 / 177<br />5.1.3 知识蒸馏 / 178<br />5.2 分布式推理 / 181<br />5.2.1 分布式推理技术 / 182<br />5.2.2 分布式推理算法 / 186<br />5.2.3 常见的分布式推理系统 / 188<br />5.2.4 分布式推理优化策略 / 189<br />5.3 边缘计算优化 / 191<br />第6章 鲁棒性、安全性和公平性<br />优化 / 194<br />6.1 模型鲁棒性优化 / 194<br />6.1.1 对抗训练 / 194<br />6.1.2 模型正则化 / 197<br />6.1.3 随机自我集成 / 198<br />6.1.4 防御模块 / 202<br />6.2 模型安全性优化 / 204<br />6.2.1 数据匿名化和加密 / 204<br />6.2.2 访问控制 / 207<br />6.2.3 验证查询和输出内容 / 208<br />6.2.4 保护向量数据库 / 210<br />6.3 模型公平性优化  / 212<br />6.3.1 检测模型偏见的方法 / 212<br />6.3.2 减少模型偏见的策略 / 214<br />第7章 RAG技术的高阶变体 / 218<br />7.1 长上下文的困境突围:<br />LongRAG / 218<br />7.1.1 原理解析 / 219<br />7.1.2 源码解析:LongRAG的<br />深度剖析 / 220<br />7.2 知识图谱的优势融合:<br />GraphRAG / 223<br />7.2.1 原理解析 / 224<br />7.2.2 源码解析:GraphRAG的深度<br />剖析 / 225<br />7.3 垂直领域的定向增强:<br />GeneRAG / 229<br />7.3.1 原理解析 / 229<br />7.3.2 源码解析:GeneRAG的深度<br />剖析 / 230<br />第8章 实时知识更新与跨模态能力<br />增强 / 235<br />8.1 实时知识更新 / 235<br />8.1.1 数据实时获取的方法 / 235<br />8.1.2 知识库动态更新 / 238<br />8.1.3 自动化数据管道 / 239<br />8.2 跨模态能力增强 / 240<br />8.2.1 多模态向量嵌入 / 240<br />8.2.2 多模态内容生成 / 243<br />附录 相似度计算 / 249

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网