您好,欢迎来到聚文网。 登录 免费注册
基于Spark NLP的自然语言处理

基于Spark NLP的自然语言处理

  • 字数: 518000
  • 装帧: 平装
  • 出版社: 中国电力出版社
  • 作者: (美)亚历克斯·托马斯
  • 出版日期: 2022-09-01
  • 商品条码: 9787519869670
  • 版次: 1
  • 开本: 16开
  • 页数: 404
  • 出版年份: 2022
定价:¥128 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
如果你想构建一个使用自然语言文本的企业级应用程序,但不确定从哪里开始或使用什么工具,本书将帮助你入门。Wisecube的首席数据科学家AlexThormas向软件工程师和数据科学家展示了如何使用深度学习和ApacheSparkNLP库,来构建可扩展的自然语言处理(NLP)应用程序。通过在Spark处理框架上使用NLP的具体示例、实践,进行理论解释和动手练习,本书将会介绍从基本语言学和写作系统到情感分析和搜索引擎的所有内容。你还将探索一些开发基于文本的应用程序会遇到的特殊问题,例如性能等。在下面四个部分中,你将学习NLP基础知识和构建模块,然后再深入研究应用程序和系统构建:基础知识:了解自然语言处理、ApacheSpark上的NLP和深度学习的基础知识。构建模块:学习构建NLP应用程序的技术(包括标记化、句子分割和命名实体识别),并了解它们的工作方式和原因。应用程序:探索构建你自己的NLP应用程序的设计、开发和实验过程。构建NLP系统:考虑生产和部署NLP模型的选项,包括支持哪些人类语言。
作者简介
亚历克斯·托马斯是Wisecube的首席数据科学家。他将自然语言处理和机器学习运用于临床数据、身份数据、雇主和求职者数据以及如今的生化数据。Alex从09版本开始使用Apache Spark,在工作中也用过包括UIMA和OpenNLP在内的多种NLP库和框架。
目录
前言
第一部分基础知识
第1章快速入门
1.1简介
1.2其他工具
1.3建立你自己的开发环境
1.3.1前置条件
1.3.2启动Apachespark
1.3.3检查代码
1.4熟悉ApacheSpark
1.4.1使用sparkNLP启动Apachespark
1.4.2在Apachespark中加载和查看数据
1.5SparkNLP的HelloWorld示例
第2章自然语言基础知识
2.1什么是自然语言
2.1.1语言的起源
2.1.2口头语言和书面语言
2.2语言学
2.2.1语音学和音系学
2.2.2词法学(形态学)
2.2.3语法
2.2.4语义学
2.3社会语言学:方言、语域和其他变体
2.3.1礼节
2.3.2语境
2.4语用学
2.4.1罗曼·雅各布森
2.4.2如何运用语用学
2.5书写系统
2.5.1起源
2.5.2字母
2.5.3辅音音素文字
2.5.4元音附标文字
2.5.5音节表
2.5.6标识象形符
2.6编码
2.6.1ASCII
2.6.2Unicode
2.6.3UTF
2.7练习:分词
2.7.1英语分词
2.7.2希腊语分词
2.7.3Ge'ez(阿姆哈拉语)分词
2.8资源
第3章ApacheSpark上的NLP
3.1并行性、并发性、分布式计算
3.1.1ApacheHadoop之前的并行化
3.1.2MapReduce和ApacheHadoop
3.1.3ApacheSpark
……
第二部分构建模块
第三部分应用
第四部分构建NLP系统
术语表

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网