您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Python网络数据爬取及分析从入门到精通 分析篇
字数: 357千字
装帧: 平装
出版社: 北京航空航天大学出版社
作者: 杨秀璋,颜娜
出版日期: 2018-06-01
商品条码: 9787512427136
版次: 1
开本: 16开
页数: 248
出版年份: 2018
定价:
¥59.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书采用通俗易懂的语言、丰富多彩的实例,详细介绍了使用Python语言进行网络数据分析的知识,主要内容包括Python数据分析常用库、可视化分析、回归分析、聚类分析、分类分析、关联规则挖掘分析、数据预处理及文本聚类、词云热点与主题分布分析、复杂网络与基于数据库技术的分析等。
书中所有知识点都结合了具体的实例进行介绍,涉及的实例都给出了详细分析流程,程序代码都给出了具体的注释,采用图文结合的形式讲解,让读者能更加轻松地领会Python网络数据分析的精髓,快速提高自己的开发能力。
本书既可作为Python开发入门者的自学用书,也可作为高等院校数据分析、数据挖掘、机器学习、大数据等相关专业的教学参考书或实验指导书,还可供Python数据分析人员查阅、参考。
作者简介
杨秀璋,毕业于北京理工大学软件学院,长期从事Web数据挖掘、Python数据分析、网络数据爬取工作及研究。他现任教于贵州财经大学信息学院,主讲“数据挖掘与分析”“大数据技术及应用”课程,并从事大数据分析、数据挖掘、知识图谱等领域的项目研究与开发;有多年的Python编程、数据分析及知识图谱研究经验,实战经验较为丰富。
此外,他还积极分享编程知识和开源代码编写经验,先后在CSDN、博客园、阿里云栖社区撰写博客,仅在CSDN就分享了300多篇原创文章,开设了11个专栏,累计阅读量超过250万人次。
目录
第1章网络数据分析概述1
1.1数据分析1
1.2相关技术3
1.3Anaconda开发环境5
1.4常用数据集9
1.4.1Sklearn数据集9
1.4.2UCI数据集10
1.4.3自定义爬虫数据集11
1.4.4其他数据集12
1.5本章小结13
参考文献14
第2章Python数据分析常用库15
2.1常用库15
2.2NumPy17
2.2.1Array用法17
2.2.2二维数组操作19
2.3Pandas21
2.3.1读/写文件22
2.3.2Series24
2.3.3DataFrame26
2.4Matplotlib26
2.4.1基础用法27
2.4.2绘图简单示例28
2.5Sklearn31
2.6本章小结32
参考文献32
第3章Python可视化分析33
3.1Matplotlib可视化分析33
3.1.1绘制曲线图33
3.1.2绘制散点图37
3.1.3绘制柱状图40
3.1.4绘制饼状图42
3.1.5绘制3D图形43
3.2Pandas读取文件可视化分析45
3.2.1绘制折线对比图45
3.2.2绘制柱状图和直方图48
3.2.3绘制箱图51
3.3ECharts可视化技术初识53
3.4本章小结57
参考文献57
第4章Python回归分析58
4.1回归58
4.1.1什么是回归58
4.1.2线性回归59
4.2线性回归分析60
4.2.1LinearRegression61
4.2.2线性回归预测糖尿病63
4.3多项式回归分析68
4.3.1基础概念68
4.3.2PolynomialFeatures69
4.3.3多项式回归预测成本和利润70
4.4逻辑回归分析73
4.4.1LogisticRegression75
4.4.2鸢尾花数据集回归分析实例75
4.5本章小结83
参考文献83
第5章Python聚类分析85
5.1聚类85
5.1.1算法模型85
5.1.2常见聚类算法86
5.1.3性能评估88
5.2K-Means90
5.2.1算法描述90
5.2.2用K-Means分析篮球数据96
5.2.3K-Means聚类优化99
5.2.4设置类簇中心103
5.3BIRCH105
5.3.1算法描述105
5.3.2用BIRCH分析氧化物数据106
5.4降维处理110
5.4.1PCA降维111
5.4.2SklearnPCA降维111
5.4.3PCA降维实例113
5.5本章小结117
参考文献118
第6章Python分类分析119
6.1分类119
6.1.1分类模型119
6.1.2常见分类算法120
6.1.3回归、聚类和分类的区别122
6.1.4性能评估123
6.2决策树123
6.2.1算法实例描述123
6.2.2DTC算法125
6.2.3用决策树分析鸢尾花126
6.2.4数据集划分及分类评估128
6.2.5区域划分对比132
6.3KNN分类算法136
6.3.1算法实例描述136
6.3.2KNeighborsClassifier138
6.3.3用KNN分类算法分析红酒类型139
6.4SVM分类算法147
6.4.1SVM分类算法的基础知识147
6.4.2用SVM分类算法分析红酒数据148
6.4.3用优化SVM分类算法分析红酒数据集151
6.5本章小结154
参考文献154
第7章Python关联规则挖掘分析156
7.1基本概念156
7.1.1关联规则156
7.1.2置信度与支持度157
7.1.3频繁项集158
7.2Apriori算法159
7.3Apriori算法的实现163
7.4本章小结167
参考文献167
第8章Python数据预处理及文本聚类168
8.1数据预处理概述168
8.2中文分词170
8.2.1中文分词技术170
8.2.2Jieba中文分词工具171
8.3数据清洗175
8.3.1概述175
8.3.2中文语料清洗176
8.4特征提取及向量空间模型179
8.4.1特征规约179
8.4.2向量空间模型181
8.4.3余弦相似度计算182
8.5权重计算184
8.5.1常用权重计算方法184
8.5.2TF-IDF185
8.5.3用Sklearn计算TF-IDF186
8.6文本聚类188
8.7本章小结192
参考文献192
第9章Python词云热点与主题分布分析193
9.1词云193
9.2WordCloud的安装及基本用法194
9.2.1WordCloud的安装194
9.2.2WordCloud的基本用法195
9.3LDA203
9.3.1LDA的安装过程203
9.3.2LDA的基本用法及实例204
9.4本章小结214
参考文献214
第10章复杂网络与基于数据库技术的分析215
10.1复杂网络215
10.1.1复杂网络和知识图谱215
10.1.2NetworkX217
10.1.3用复杂网络分析学生关系网219
10.2基于数据库技术的数据分析224
10.2.1数据准备224
10.2.2基于数据库技术的可视化分析225
10.2.3基于数据库技术的可视化对比232
10.3基于数据库技术的博客行为分析234
10.3.1幂率分布234
10.3.2用幂率分布分析博客数据集235
10.4本章小结245
参考文献245
本套后记246
致谢248
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网