您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
数据科学与大数据技术导论
字数: 334000
装帧: 平装
出版社: 人民邮电出版社
出版日期: 2021-02-01
商品条码: 9787115532978
版次: 1
开本: 16开
页数: 248
出版年份: 2021
定价:
¥49.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
1.详细介绍数据科学的基本概念和内涵 2.培养读者初步具备用开源工具进行数据分析的能力 3.培训读者了解大数据技术的框架,为今后系统学习打下基础 4.培养读者对大数据分析的兴趣,愿意为从事该领域的工作进一步学习
内容简介
本书从数据科学与大数据技术专业学生的第一门导论性课程的角度出发,全面系统地介绍了数据科学的基本概念和内涵、常见编程语言Python、数据分析方法、大数据技术的框架等知识。本书作为导论性质的教材,目的不在于对某个具体的技术平台进行细致的深入介绍,而是尽量让读者体会整个大数据处理的技术流程,使读者能够掌握大数据技术的整体框架,能够在未来的学习和工作中通过系统化的大数据思维能力为所遇到的问题提供解决思路和方案。本书可作为数据科学与大数据技术、软件工程、计算机科学与技术等专业的大数据导论课程的教材,也可供大数据工程技术人员参考使用。
目录
第1章数据科学概论1
1.1数据与大数据1
1.2大数据应用案例——从数据到知识,数据思维浅析2
1.2.1数据密集型科学发现3
1.2.2电子商务与推荐技术5
1.2.3网络舆情管理6
1.2.4数据思维7
1.3数据科学与数据科学家7
1.4数据科学与大数据技术课程的内容体系与具体内容11
1.5思考题12
第2章Python语言与数据科学13
2.1Python概述13
2.2Python开发环境配置14
2.3变量、常量和注释16
2.4数据类型16
2.4.1布尔型17
2.4.2整数17
2.4.3浮点数17
2.4.4字符串17
2.4.5列表18
2.4.6元组19
2.4.7字典19
2.5运算符及其优先级、表达式20
2.6程序的基本结构21
2.6.1顺序结构21
2.6.2分支结构22
2.6.3循环结构22
2.6.4编写完整的程序23
2.6.5程序实例:二分查找24
2.7函数以及库函数24
2.8面向对象编程27
2.8.1构造函数28
2.8.2对象的摧毁和垃圾回收28
2.8.3继承28
2.8.4重写28
2.9异常处理29
2.10第三方库和实例29
2.10.1机器学习库scikit-learn简介30
2.10.2深度学习库Keras简介30
2.10.3绘图库matplotlib简介30
2.10.4社交网络与图数据处理库networkX简介31
2.10.5自然语言处理库NLTK简介31
2.10.6pandas库入门31
2.11思考题38
第3章数据分析基础39
3.1数据模型39
3.1.1数组39
3.1.2图42
3.1.3关系模型44
3.1.4时序模型45
3.2数据分析流程与数据生命期45
3.2.1业务理解45
3.2.2数据理解46
3.2.3数据准备46
3.2.4建模46
3.2.5评估47
3.2.6部署47
3.3数据分析的基础方法47
3.3.1描述性分析47
3.3.2诊断性分析48
3.3.3预测性分析48
3.3.4规范分析49
3.4大数据平台49
3.4.1Hadoop49
3.4.2Hive51
3.4.3Mahout52
3.4.4Spark52
3.4.5Storm53
3.4.6Flink53
3.4.7Neo4j54
3.5思考题54
第4章数据可视化55
4.1可视化的定义55
4.2可视化发展历程55
4.3可视化的意义和价值57
4.4数据可视化的流程59
4.5常见可视化图表59
4.5.1柱状图60
4.5.2折线图61
4.5.3饼图61
4.5.4散点图61
4.5.5雷达图61
4.6可视化图表工具62
4.7思考题64
第5章数据分析与计算65
5.1机器学习简介65
5.2分类67
5.2.1支持向量机67
5.2.2决策树70
5.2.3朴素贝叶斯方法72
5.2.4K最近邻(KNN)算法75
5.2.5逻辑斯蒂回归76
5.2.6分类算法的实例77
5.3聚类81
5.3.1K-Means算法81
5.3.2DBSCAN算法83
5.3.3聚类实例85
5.4回归88
5.4.1线性回归与多元线性回归88
5.4.2回归实例90
5.5关联规则分析92
5.5.1关联规则分析92
5.5.2关联规则分析实例95
5.6推荐97
5.6.1基于用户的协同过滤推荐98
5.6.2基于项目的协同过滤推荐100
5.7神经网络与深度学习101
5.7.1神经网络101
5.7.2深度学习104
5.7.3神经网络与深度学习实例112
5.8云计算平台与主流大数据平台119
5.8.1云计算平台119
5.8.2Hadoop大数据处理平台与MapReduce计算模型121
5.8.3Spark大数据处理平台与DAG计算模型128
5.9思考题134
第6章文本分析135
6.1文本分析的背景和意义135
6.2文本表达136
6.2.1单词的局域性表示和分布式表示136
6.2.2基于话题模型的文本表示139
6.2.3基于词嵌入的文本表示139
6.3文本聚类140
6.3.1聚类分析问题描述141
6.3.2常用聚类算法142
6.4文本分类144
6.4.1分类问题定义144
6.4.2主要文本分类方法144
6.5思考题149
第7章数据存储与管理150
7.1数据管理的初级阶段——文件管理150
7.2层次数据库和网状数据库151
7.3关系数据库管理系统153
7.3.1关系数据模型153
7.3.2数据操作154
7.3.3事务处理、并发控制和恢复技术155
7.3.4SQL入门156
7.4NoSQL数据库160
7.4.1CAP理论与NoSQL数据库160
7.4.2KeyValue数据库161
7.4.3ColumnFamily数据库164
7.4.4Document数据库165
7.4.5Graph数据库166
7.5NewSQL及其代表VoltDB167
7.5.1事务的串行执行167
7.5.2通过存储过程存取数据库167
7.5.3数据分区策略考虑尽量避免跨节点数据通信168
7.5.4命令日志与恢复技术168
7.6思考题168
第8章数据采集与集成170
8.1数据采集170
8.1.1数据采集的重要因素171
8.1.2推-拉机制171
8.1.3发布-订阅机制172
8.1.4大数据收集系统172
8.1.5自定义连接器173
8.2信息抽取173
8.2.1信息抽取概述174
8.2.2半结构化数据和非结构化数据174
8.2.3信息抽取的关键技术176
8.3数据清洗178
8.3.1数据清洗的定义及对象178
8.3.2数据清洗原理179
8.3.3数据清洗方法179
8.4数据集成181
8.4.1数据集成概述182
8.4.2数据集成方法183
8.4.3数据集成的数据源异构问题186
8.5思考题188
第9章数据治理189
9.1数据治理的业务驱动力189
9.2数据治理的概念190
9.3数据治理的目标191
9.3.1实现价值191
9.3.2管控风险192
9.4数据治理的要素和框架192
9.4.1人员要素194
9.4.2技术要素196
9.5数据治理的实践201
9.5.1各个业务子系统的建设和数据治理同步推进201
9.5.2建立数据治理的组织机构,确定数据治理战略/政策和标准201
9.5.3规划具体的数据治理任务201
9.5.4开展数据治理工作202
9.5.5数据治理的评价203
9.6大数据时代数据治理的挑战203
9.7思考题204
第10章数据科学综合案例205
10.1利用现成分类器对Twitter数据集进行情感分类206
10.2如何自行构造一个文本分类器209
10.3综合实例218
10.4思考题232
参考文献233
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网