您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
spaCy自然语言处理从入门到进阶
字数: 236000
装帧: 平装
出版社: 电子工业出版社
作者: 王冠,孔晓泉 编
出版日期: 2025-01-01
商品条码: 9787121491283
版次: 1
开本: 16开
页数: 260
出版年份: 2025
定价:
¥89
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书是一本全面、实用、易懂的spaCy学习指南,专为对自然语言处理(NLP)感兴趣的读者设计。它以中文应用为核心,从基础概念到高级应用,逐步深入讲解spaCy这一高效的Python NLP库。书中不仅涵盖了分词、词性标注、命名实体识别等核心功能,还详细介绍了如何利用这些功能来构建强大的NLP应用。通过丰富的案例和示例代码,本书能够帮助读者快速掌握spaCy的使用方法,并将其应用于实际任务中,无论是文本分析、情感分析还是机器学习模型的构建。
对于自然语言处理的初学者来说,本书提供了一个结构化的学习方法,从最基础的NLP概念开始,逐步引导读者理解并应用spaCy库。对于开发者和数据科学家,书中的高级应用和最佳实践可以帮助他们提升现有技能,解决更复杂的NLP问题。无论是想系统学习NLP还是想针对性提升特定技能,本书都是理想的选择。它不仅适合个人学习,也适合作为团队或教育机构的教学资源。通过本书的学习,读者将能够更加自信地处理各种语言数据,开发出更加智能和高效的NLP解决方案。
目录
第1章spaCy简介.1
1.1自然语言处理的发展过程.1
1.2自然语言处理的基础任务.6
1.3spaCy的核心概念.7
1.3.1nlp对象.9
1.3.2Doc对象.10
1.3.3Token对象.12
1.3.4Span对象.14
1.4spaCy的安装方法.16
1.4.1使用pip安装.16
1.4.2使用Conda安装.16
1.5spaCy的基础操作.17
1.5.1训练模型.17
1.5.2预测模型.21
第2章抽取语言学特征.24
2.1基本操作.24
2.1.1分词.24
2.1.2截取词符.26
2.1.3获取文本特征.28
2.1.4词性标注.31
2.1.5依存关系解析.32
2.1.6命名实体识别.33
2.2用已有模型预测.35
2.2.1预测文字、词性标签和依存关系标签.37
2.2.2预测命名实体识别的结果.38
2.2.3手动创建命名实体.39
2.3基于规则的匹配器.42
2.3.1Matcher与正则表达式.44
2.3.2模板匹配.45
2.4定义匹配规则.53
2.4.1运算符和量词.53
2.4.2文本匹配.57
2.4.3词性匹配.59
第3章信息提取.62
3.1数据结构的基本概念.62
3.2词汇表、字符串库和语素.63
3.2.1词汇表和字符串库.65
3.2.2语素.66
3.2.3转换.68
3.3文档、截取和词符.72
3.3.1文档及其创建.73
3.3.2截取及其创建.76
3.3.3词符及其创建.80
3.4综合实践――比对相似度.84
3.4.1训练词向量.85
3.4.2处理文本.88
3.4.3计算相似度.89
3.5综合实践――文本匹配.96
3.5.1基于规则的方法.98
3.5.2匹配不成功时的调试方法.102
3.5.3直接精确匹配字符串.105
第4章流程.109
4.1流程组件.109
4.1.1流程组件的概念.109
4.1.2流程组件的运行.111
4.1.3流程组件的属性.112
4.1.4流程组件的配置.113
4.1.5流程组件的检查.114
4.2定制化流程组件.115
4.2.1定制化流程组件的应用.116
4.2.2定制化流程组件的应用示例.117
4.2.3用定制化流程组件打印文档的词符长度.119
4.2.4定制化流程组件的综合应用示例.121
4.3定制化属性.123
4.3.1添加定制化属性.123
4.3.2注册定制化属性.124
4.3.3定制化属性的类别.125
4.3.4设置定制化属性.131
4.4定制化模型组件.137
4.5含有定制化属性的定制化流程组件.140
4.6流程的优化.142
4.6.1流模式.142
4.6.2传入语境.143
4.6.3仅使用分词器.146
4.6.4关闭流程组件.146
……
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网