您好,欢迎来到聚文网。 登录 免费注册
Python自然语言处理入门

Python自然语言处理入门

  • 字数: 334000
  • 装帧: 平装
  • 出版社: 中国水利水电出版社
  • 作者: (日)赤石雅典,(日)江泽美保
  • 出版日期: 2022-01-01
  • 商品条码: 9787517098294
  • 版次: 1
  • 开本: 32开
  • 页数: 360
  • 出版年份: 2022
定价:¥99.8 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
《Python自然语言处理入门》是一本使用Python解释在人工智能领域备受关注的自然语言分析方法的入门书,内容涵盖“检索技术”“实体提取”“关系提取”“语素分析”和“评估/情感/概念分析”等自然语言处理中的常用知识,同时对传统技术和引入了AI新技术的特点作了对比。全书以一线AI工程师的实际项目经验为后盾,对自然语言处理的要点进行了归纳总结,并介绍了使用Python程序、API、商业服务(IBMWatson)和OSS(MeCab/Elasticsearch/Word2Vec)等进行自然语言处理的实用方法,在最后一章中,还介绍了BERT的相关内容,特别适合想学习自然语言处理的理工科学生和人工智能工程师进行参考和学习。
目录
第1章 文本分析
1.1 文本分析的目的
1.1.1 结构化数据与非结构化数据
1.1.2 查找
1.1.3 发现
1.2 文本分析的基本技术
1.2.1 文本分析技术的全貌
1.2.2 基于文本分析技术的本书结构分析
第2章 日语文本分析:预处理的要点
2.1 文本数据的获取
2.1.1 作为分析对象文本数据的条件
2.1.2 青空文库
2.1.3 利用维基百科API获取文本
2.1.4 从PDF和Word文档中获取文本
2.1.5 从Web页面中获取文本
2.1.6 使用API获取文本的方法
2.1.7 从DBpedia中获取文本
2.1.8 其他获取文本的方法
2.2 语素分析
2.2.1 语素分析的目的
2.2.2 语素分析引擎的种类
2.2.3 MeCab分词包的使用
2.2.4 Janome分词包的使用
2.2.5 与字典的结合使用
第3章 传统的文本分析与检索技术
3.1 相关性分析
3.1.1 语素分析与相关性分析的关系
3.1.2 CaboCha的使用
3.1.3 使用naruhodo进行可视化处理
3.2 检索
3.2.1 Elasticsearch的安装
3.2.2 Elasticsearch的使用
3.3 日文检索
3.3.1 Python应用程序接口的导入
3.3.2 日文用分析器的设置
3.3.3 日文文档的检索
3.3.4 复杂的日文检索(同义词和字典的使用)
3.4 检索结果的评分
3.4.1 TF-IDF
3.4.2 Elasticsearch中的评分功能
3.5 类似检索
第4章 基于商用API的文本分析与检索技术
4.1 IBM Cloud中的文本分析API概览
4.1.1 Watson API服务的总览
4.1.2 Natural Language Understanding(NLU)
4.1.3 Knowledge Studio
4.1.4 Discovery
4.1.5 其他的API
4.2 NLU
4.2.1 NLU(自然语言理解)
4.2.2 实例的创建
4.2.3 使用Python时的推荐操作
4.2.4 实体提取功能
4.2.5 关系提取功能
4.2.6 评价分析功能
4.2.7 关键词提取功能
4.2.8 其他功能
4.3 Knowledge Studio
4.3.1 何谓Knowledge Studio
4.3.2 创建模型所必需的操作流程
4.3.3 实例与Workspace的创建
4.3.4 事先准备操作(定义Type System/字典)
4.3.5 标注操作(从读入文档到人工标注)
4.3.6 机器学习模型的训练与评估
4.3.7 模型的使用方法(与NLU联动)
4.4 Discovery
4.4.1 何谓Discovery
4.4.2 文档的读取
4.4.3 Enrich
4.4.4 Query
4.4.5 排名学习
4.5 使用Discovery模块
4.5.1 环境的创建
4.5.2 数据集合的创建
4.5.3 管理界面
4.5.4 使用SDU定义字段
4.5.5 字段的详细定义(字段管理、Enrich设置)
4.5.6 文档的读入
4.5.7 使用DQL进行搜索
4.5.8 同义词字典的使用
4.5.9 与Knowledge Studio的联动
4.6 通过API使用Discovery
4.6.1 API的初始化
4.6.2 文档的载入与删除
4.6.3 搜索
4.6.4 语素字典的使用
4.6.5 相似搜索的执行
4.7 基于Discovery的排名学习
4.7.1 何谓排名学习
4.7.2 使用图形界面工具进行排名学习
4.7.3 性能/仪表盘功能
4.8 通过API使用Discovery进行排序学习
4.8.1 排序学习的准备
4.8.2 学习的实施
第5章 Word2Vec与BERT
5.1 Word2Vec模型概要
5.1.1 Word2Vec的学习方法
5.1.2 Word2Vec模型的结构
5.1.3 学习时的目的与真正的目标
5.1.4 Word2Vec所生成特征向量的性质
5.2 Word2Vec的使用
5.2.1 自行学习的方法
5.2.2 使用已经完成训练的模型
5.3 Word2Vec应用案例
5.3.1 将Word2Vec作为简易分类器用于预处理
5.3.2 在商用API内部的运用
5.3.3 在自动推荐系统中的应用
5.4 Word2Vec的关联技术
5.4.1 Glove
5.4.2 fastText
5.4.3 Doc2Vec
5.5 迁移学习与BERT
5.5.1 图像识别与迁移学习
5.5.2 BERT的特点
5.5.3 具有通用性的预先学习
5.5.4 各种适用领域
5.5.5 基于较新研究成果的神经网络模型
5.5.6 使用预先学习模型

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网