您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Python自然语言处理入门与实战
字数: 261000
装帧: 平装
出版社: 人民邮电出版社
出版日期: 2022-10-01
商品条码: 9787115592781
版次: 1
开本: 16开
页数: 224
出版年份: 2022
定价:
¥59.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
1. 泰迪大数据套系 2. 随书附带Python源码,方便读者系统学习并动手实践 3. 技术与实例相结合,使读者深入学习自然语言处理在新闻方向的应用
内容简介
本书以自然语言处理常用技术与真实案例相结合的方式,深入浅出地介绍自然语言处理中的关键内容。全书共8章,内容包括导论、文本数据爬取、文本基础处理、文本进阶处理、天问一号事件中的网民评论情感分析、新闻文本分类、基于浏览记录的个性化新闻推荐,以及基于TipDM大数据挖掘建模平台实现新闻文本分类。本书各章均包含课后习题,其中前4章为选择题,后4章为操作题,可帮助读者通过练习和操作实践,巩固所学的内容。本书可作为高校数据科学、人工智能和新闻传播相关专业的教材,也可作为自然语言处理爱好者的自学用书。
作者简介
张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编图书《神经网络实用教程》、《数据挖掘:实用案例分析》、《MATLAB数据分析与挖掘实战》等9本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。
目录
第1章 导论
1.1 自然语言处理概述
1.1.1 发展历程
1.1.2 研究任务
1.1.3 自然语言处理与新闻传媒
1.2 自然语言处理工具
1.2.1 常见的自然语言处理工具
1.2.2 Python与自然语言处理
1.3 NLP的开发环境
1.3.1 Anaconda安装
1.3.2 Anaconda应用介绍
小结
课后习题
第2章 文本数据爬取
2.1 HTTP通信基础
2.1.1 熟悉HTTP请求方法与过程
2.1.2 熟悉常见HTTP状态码
2.1.3 熟悉HTTP头部信息
2.1.4 熟悉Cookie
2.2 静态网页爬取
2.2.1 实现HTTP请求
2.2.2 网页解析
2.2.3 数据存储
2.3 动态网页爬取
2.3.1 逆向分析爬取
2.3.2 使用Selenium库爬取
小结
课后习题
第3章 文本基础处理
3.1 语料库
3.1.1 语料库概述
3.1.2 语料库种类与原则
3.1.3 NLTK库
3.1.4 语料库的获取
3.1.5 语料库的构建与应用
3.2 分词与词性标注
3.2.1 中文分词简介
3.2.2 基于规则的分词
3.2.3 基于统计的分词
3.2.4 中文分词工具jieba库
3.2.5 词性标注简介
3.2.6 词性标注规范
3.2.7 jieba词性标注
3.3 命名实体识别
3.3.1 命名实体识别简介
3.3.2 CRF模型
3.3.3 命名实体识别流程
3.4 关键词提取
3.4.1 关键词提取技术简介
3.4.2 关键词提取算法
3.4.3 自动提取文本关键词
小结
课后习题
第4章 文本进阶处理
4.1 文本向量化
4.1.1 文本向量化简介
4.1.2 文本离散表示
4.1.3 分布式表示
4.1.4 Word2Vec词向量的训练
4.2 文本相似度计算
4.2.1 文本相似度的定义
4.2.2 文本的表示
4.2.3 常用文本相似度算法
4.3 文本分类与聚类
4.3.1 文本挖掘简介
4.3.2 文本分类常用算法
4.3.3 文本聚类常用算法
4.3.4 文本分类与聚类的步骤
4.3.5 新闻文本分类
4.3.6 新闻文本聚类
小结
课后习题
第5章 天问一号事件中的网民评论情感分析
5.1 业务背景与项目目标
5.1.1 业务背景
5.1.2 数据说明
5.1.3 分析目标
5.2 分析方法与过程
5.2.1 数据探索
5.2.2 文本预处理
5.2.3 绘制词云图
5.2.4 使用朴素贝叶斯构建情感分类模型
5.2.5 模型评估
5.2.6 模型优化
小结
课后习题
第6章 新闻文本分类
6.1 业务背景与项目目标
6.1.1 业务背景
6.1.2 数据说明
6.1.3 分析目标
6.2 分析方法与过程
6.2.1 数据采集
6.2.2 数据探索
6.2.3 文本预处理
6.2.4 SVM模型构建
6.2.5 模型评价
小结
课后习题
第7章 基于浏览记录的个性化新闻推荐
7.1 业务背景与项目目标
7.1.1 业务背景
7.1.2 数据说明
7.1.3 分析目标
……
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网