您好,欢迎来到聚文网。 登录 免费注册
快速部署大模型(LLM策略与实践基于ChatGPT等大语言模型)

快速部署大模型(LLM策略与实践基于ChatGPT等大语言模型)

  • 字数: 265
  • 出版社: 清华大学
  • 作者: (美)斯楠·奥兹德米尔|译者:姚普//白涛//卜崇宇//王蜀洪
  • 商品条码: 9787302661610
  • 版次: 1
  • 开本: 16开
  • 页数: 198
  • 出版年份: 2024
  • 印次: 1
定价:¥79 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
作为人工智能领域的前 沿技术之一,大语言模型( LLM)的出现正逐步改变人 类对语言、沟通乃至认知的 理解。这些模型通过不断迭 代与升级,不仅在自然语言 处理领域取得了革命性突破 ,更是将人工智能的应用推 向了一个崭新的高度。从简 单的问答到复杂的文字生成 ,从初级的情感理解到撰写 具有丰富感情色彩的文章, LLM有着令人着迷的魔力, 并驱使着人们不断探索与实 践,发现更多令人兴奋的秘 密。 本书覆盖了大模型基本 结构概述、提示词工程、大 模型的微调、强化学习与人 类反馈等基础理论知识,也 包含采用大模型制作检索引 擎、推荐系统、文图检索等 人门应用实践,还介绍了大 模型应用于商业生产时,开 源与闭源的策略选择等,能 够帮助广大读者对大模型的 相关知识有一个快速的认知 ,进而帮助读者快速融入人 工智能时代。
作者简介
斯楠·奥兹德米尔(Sinan Ozdemir),是一名数据科学家、创业者和教育工作者。Sinan的学术生涯在约翰·霍普金斯大学(The Johns Hopkins University)渡过,主修数学专业。随后他从事教育事业,曾经在约翰·霍普金斯大学和General Assembly公司举办多次数据科学讲座。在此之后,他创立了旨在通过人工智能技术和数据科学力量帮助企业销售团队的创业公司Legion Analytics。
目录
第1部分 大模型介绍 第1章 大模型概述 1.1 什么是大模型 1.1.1 大模型的定义 1.1.2 大模型的关键特征 1.1.3 大模型是如何工作的 1.2 当前流行的大模型 1.2.1 BERT 1.2.2 GPT-3和ChatGPT 1.2.3 T5 1.3 垂直领域大模型 1.4 大模型的应用 1.4.1 经典的NLP任务 1.4.2 自由文本生成 1.4.3 信息检索/神经语意搜索 1.4.4 聊天机器人 1.5 本章小结 第2章 大模型语义检索 2.1 简介 2.2 语义检索的任务 2.3 非对称语义检索方案概述 2.4 组件 2.4.1 文本嵌入器 2.4.2 文档分块 2.4.3 向量数据库 2.4.4 Pinecone 2.4.5 开源替代方案 2.4.6 检索结果重排 2.4.7 API 2.5 完整方案 2.6 闭源组件的成本 2.7 本章小结 第3章 提示词工程入门 3.1 简介 3.2 提示词工程 3.2.1 LLM的对齐 3.2.2 LLM提问 3.2.3 小样本学习 3.2.4 结构化输出 3.2.5 人物角色提示词 3.3 跨模型提示词工程 3.3.1 ChatGPT 3.3.2 Cohere 3.3.3 开源提示词工程 3.4 采用ChatGPT构建问答机器人 3.5 本章小结 第2部分 充分挖掘大模型的潜力 第4章 通过定制化微调优化大模型 4.1 简介 4.2 迁移学习与微调入门

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网