您好,欢迎来到聚文网。 登录 免费注册
数据科学技术(文本分析和知识图谱全彩印刷)

数据科学技术(文本分析和知识图谱全彩印刷)

  • 字数: 580
  • 出版社: 清华大学
  • 作者: 苏海波//刘译璟//易显维//苏萌|责编:赵军
  • 商品条码: 9787302649700
  • 版次: 1
  • 开本: 16开
  • 页数: 334
  • 出版年份: 2024
  • 印次: 1
定价:¥129 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
数据科学的关键技术包 括数据存储计算、数据治理 、结构化数据分析、语音分 析、视觉分析、文本分析和 知识图谱等方面。本书的重 点是详细介绍文本分析和知 识图谱方面的技术。文本分 析技术主要包括文本预训练 模型、多语种文本分析、文 本情感分析、文本机器翻译 、文本智能纠错、NL2SQL 问答以及ChatGPT大语言模 型等。知识图谱技术主要包 括知识图谱构建和知识图谱 问答等。本书将理论介绍和 实践相结合,详细阐述各个 技术主题的实现路线,并对 应用于业界算法大赛中的技 术方案和技巧进行源代码解 读,帮助读者深入理解技术 原理。最后,本书还介绍了 文本分析和知识图谱技术在 政务、公共安全、应急等多 个行业中的智能应用实践案 例。 本书适合具备Python和 机器学习技术基础的高等院 校学生、文本分析(或者自 然语言处理)以及知识图谱 领域的算法工程师和研究机 构的研究者阅读,也适合数 据科学和人工智能领域的研 究者作为参考书。
作者简介
\"苏海波,清华大学电子工程系博士,副研究员,百分点科技首席算法科学家。擅长人工智能领域的自然语言理解、知识图谱、深度学习、个性化推荐以及计算广告技术,有丰富的研发实践经验;曾就职于新浪微博,负责广告系统的算法效果优化,以及信息流产品整体算法策略的设计及研发;现负责百分点大数据与人工智能核心算法,带领团队研发智能校对系统、智能问答系统、知识图谱系统等多款认知智能产品,荣获业界多项奖项,并获得不错的商业化落地效果。 多篇SCI和EI论文发表于 GLOBECOM、ICC、IEICE Transactions 等国外顶尖学术会议和期刊,获得国家发明专利20余项,曾担任科技部重点研发计划子课题负责人。获得2019年和2020年北京市科学技术进步奖,获得2019年全球人工智能与机器学习大会(AiCon)明星讲师,指导团队获得2021 CCKS(全国知识图谱与语义计算大会)知识图谱问答大赛的季军。\"
目录
第1章 什么是数据科学 1.1 数据科学的定义 1.1.1 数据科学的背景 1.1.2 数据科学的定义 1.2 数据科学的关键技术 1.2.1 数据存储计算 1.2.2 数据治理 1.2.3 结构化数据分析 1.2.4 语音分析 1.2.5 视觉分析 1.2.6 文本分析 1.2.7 知识图谱 1.3 本章小结 1.4 习题 1.5 本章参考文献 第2章 文本预训练模型 2.1 文本分析技术的发展史 2.2 Transformer模型结构 2.3 预训练模型的结构和变种 2.4 加速处理器GPU和TPU 2.4.1 GPU的介绍 2.4.2 GPU产品命名 2.4.3 TPU和GPU的区别 2.4.4 TPU的使用总结 2.5 预训练模型的常见问题 2.5.1 模型输入的常见问题 2.5.2 模型原理的常见问题 2.5.3 模型进化的常见问题 2.6 预训练模型的源码解读 2.6.1 模型架构 2.6.2 BertModel 2.6.3 BERT预训练任务 2.6.4 BERT微调 2.7 本章小结 2.8 习题 2.9 本章参考文献 第3章 多语种文本分析 3.1 多语种文本分析背景介绍 3.2 多语种文本分析技术 3.2.1 Polyglot技术 3.2.2 Multilingual BERT 3.2.3 XLM多语言模型 3.2.4 XLMR多语言模型 3.2.5 模型实验效果 3.3 多语种文本分析源码解读 3.4 本章小结 3.5 习题 3.6 本章参考文献 第4章 文本情感分析 第5章 文本机器翻译 第6章 文本智能纠错 第7章 知识图谱构建 第8章 知识图谱问答 第9章 结构化知识NL2SQL问答 第10章 ChatGPT大语言模型 第11章 行业实践案例

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网