您好,欢迎来到聚文网。 登录 免费注册
spaCy自然语言处理从入门到进阶

spaCy自然语言处理从入门到进阶

  • 字数: 236000
  • 装帧: 平装
  • 出版社: 电子工业出版社
  • 作者: 王冠,孔晓泉 编
  • 出版日期: 2025-01-01
  • 商品条码: 9787121491283
  • 版次: 1
  • 开本: 16开
  • 页数: 260
  • 出版年份: 2025
定价:¥89 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
   本书是一本全面、实用、易懂的spaCy学习指南,专为对自然语言处理(NLP)感兴趣的读者设计。它以中文应用为核心,从基础概念到高级应用,逐步深入讲解spaCy这一高效的Python NLP库。书中不仅涵盖了分词、词性标注、命名实体识别等核心功能,还详细介绍了如何利用这些功能来构建强大的NLP应用。通过丰富的案例和示例代码,本书能够帮助读者快速掌握spaCy的使用方法,并将其应用于实际任务中,无论是文本分析、情感分析还是机器学习模型的构建。

对于自然语言处理的初学者来说,本书提供了一个结构化的学习方法,从最基础的NLP概念开始,逐步引导读者理解并应用spaCy库。对于开发者和数据科学家,书中的高级应用和最佳实践可以帮助他们提升现有技能,解决更复杂的NLP问题。无论是想系统学习NLP还是想针对性提升特定技能,本书都是理想的选择。它不仅适合个人学习,也适合作为团队或教育机构的教学资源。通过本书的学习,读者将能够更加自信地处理各种语言数据,开发出更加智能和高效的NLP解决方案。
目录
第1章spaCy简介.1
1.1自然语言处理的发展过程.1
1.2自然语言处理的基础任务.6
1.3spaCy的核心概念.7
1.3.1nlp对象.9
1.3.2Doc对象.10
1.3.3Token对象.12
1.3.4Span对象.14
1.4spaCy的安装方法.16
1.4.1使用pip安装.16
1.4.2使用Conda安装.16
1.5spaCy的基础操作.17
1.5.1训练模型.17
1.5.2预测模型.21
第2章抽取语言学特征.24
2.1基本操作.24
2.1.1分词.24
2.1.2截取词符.26
2.1.3获取文本特征.28
2.1.4词性标注.31
2.1.5依存关系解析.32
2.1.6命名实体识别.33
2.2用已有模型预测.35
2.2.1预测文字、词性标签和依存关系标签.37
2.2.2预测命名实体识别的结果.38
2.2.3手动创建命名实体.39
2.3基于规则的匹配器.42
2.3.1Matcher与正则表达式.44
2.3.2模板匹配.45
2.4定义匹配规则.53
2.4.1运算符和量词.53
2.4.2文本匹配.57
2.4.3词性匹配.59
第3章信息提取.62
3.1数据结构的基本概念.62
3.2词汇表、字符串库和语素.63
3.2.1词汇表和字符串库.65
3.2.2语素.66
3.2.3转换.68
3.3文档、截取和词符.72
3.3.1文档及其创建.73
3.3.2截取及其创建.76
3.3.3词符及其创建.80
3.4综合实践――比对相似度.84
3.4.1训练词向量.85
3.4.2处理文本.88
3.4.3计算相似度.89
3.5综合实践――文本匹配.96
3.5.1基于规则的方法.98
3.5.2匹配不成功时的调试方法.102
3.5.3直接精确匹配字符串.105
第4章流程.109
4.1流程组件.109
4.1.1流程组件的概念.109
4.1.2流程组件的运行.111
4.1.3流程组件的属性.112
4.1.4流程组件的配置.113
4.1.5流程组件的检查.114
4.2定制化流程组件.115
4.2.1定制化流程组件的应用.116
4.2.2定制化流程组件的应用示例.117
4.2.3用定制化流程组件打印文档的词符长度.119
4.2.4定制化流程组件的综合应用示例.121
4.3定制化属性.123
4.3.1添加定制化属性.123
4.3.2注册定制化属性.124
4.3.3定制化属性的类别.125
4.3.4设置定制化属性.131
4.4定制化模型组件.137
4.5含有定制化属性的定制化流程组件.140
4.6流程的优化.142
4.6.1流模式.142
4.6.2传入语境.143
4.6.3仅使用分词器.146
4.6.4关闭流程组件.146
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网