您好,欢迎来到聚文网。 登录 免费注册
基于Python的智能文本分析

基于Python的智能文本分析

  • 字数: 392000
  • 装帧: 平装
  • 出版社: 中国电力出版社
  • 作者: (美)本杰明·班福特(Benjamin Bengfort),(美)瑞贝卡·比尔布罗(Rebecca Bilbro),(美)托尼·奥杰达(Tony Ojeda)
  • 出版日期: 2017-12-01
  • 商品条码: 9787519838294
  • 版次: 1
  • 开本: 16开
  • 页数: 328
  • 出版年份: 2017
定价:¥88 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
·预处理并将文本向量化成高维特征表示。
·执行文档分类和主题建模。
·通过可视化诊断指导模型选择过程。
·提取关键短语、命名实体和图结构,实现文本数据推断。
·建立对话框架,实现聊天机器人和语言驱动交互。
·用Spark扩展处理能力,用神经网络实现对更复杂模型的支持。
作者简介
Benjamin Bengfort是一位专门研究分布式系统、机器学习及其他相关技术的计算机科学家。Rebecca Bilbro是一名数据科学家和Python程序员,致力于研究机器学习工作流的可视化诊断。Tony Ojeda是District Data Labs的创始人和CEO,专注于商业策略应用分析、优化、预测服务,以及开源工具使用课程。陈光,北京邮电大学副教授,主要研究方向为机器学习和自然语言处理。
目录
前言1
第1章语言与计算13
数据科学范式14
语言感知数据产品16
语言即数据21
小结29
第2章构建自定义语料库31
语料库是什么?32
语料库数据管理35
语料库读取器39
小结49
第3章语料库预处理与处置50
分解文档50
语料库的转换60
小结67
第4章文本向量化和转换流水线68
空间中的词69
Scikit-LearnAPI81
流水线88
小结93
第5章面向文本分析的文本分类95
文本分类96
构建文本分类应用99
小结110
第6章文本相似性聚类112
文本上的无监督学习112
文档相似性聚类114
文档主题建模127
小结139
第7章上下文感知文本分析140
基于语法的特征提取141
n-Gram特征提取147
n-Gram语言模型155
小结165
第8章文本可视化166
可视化特征空间167
模型诊断185
可视化操纵193
小结196
第9章文本的图分析198
图计算与分析200
从文本中抽取图204
实体解析216
小结221
第10章聊天机器人223
对话基础224
礼貌对话规则231
有趣的问题239
学习帮助250
小结257
第11章利用多处理和Spark扩展文本分析259
Python多处理260
Spark集群计算271
小结289
第12章深度学习与未来291
应用神经网络292
神经网络语言模型292
情感分析303
未来(几乎)已来309
词汇表311

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网