您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
大数据分析原理与实践/数据科学与工程技术丛书
出版社: 机械工业
作者: 编者:王宏志
商品条码: 9787111569435
版次: 1
开本: 16开
页数: 443
出版年份: 2017
印次: 1
定价:
¥79
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
王宏志编著的《大数据分析原理与实践》介绍了 大数据分析的多种模型、所涉及的算法和技术、实现 大数据分析系统所需的工具以及大数据分析的具体应 用。 本书共16章。第1章为绪论,就大数据、大数据 分析等概念进行了阐释,并对本书内容进行了概述; 第2-7章介绍了关联分析模型、分类分析模型、聚类 分析模型、结构分析模型和文本分析模型;第8章介 绍大数据分析的数据预处理问题;第9章介绍降维方 法;第10章介绍了数据仓库的概念、内涵、组成、体 系结构和建立方法,还介绍了分布式数据仓库系统和 内存数据仓库系统。第11章介绍大数据分析算法中的 回归算法、关联规则挖掘算法、分类算法以及聚类算 法的实现。第12-14章介绍了三种用于实现大数据分 析算法的平台,即并行计算平台、流式计算平台和大 图分析平台。第15章和第16章介绍两类大数据分析的 具体应用,分别讲述了社会网络分析和推荐系统。 本书可作为高等院校大数据相关专业的教学用书 ,也可以作为从事大数据相关工作的工程技术人员的 参考用书。
作者简介
王宏志,哈尔滨工业大学计算机科学与技术学院副教授、博士生导师。研究方向包括大数据管理、数据质量、图数据管理。发表学术论文140余篇,出版学术专著两本,参与翻译《算法导论(第3版)》。在爱课程网、学堂在线、好大学在线上首次开设“大数据算法”在线课程,出版《大数据算法》教材。
目录
序 前言 教学建议 第1章 绪论 1.1 什么是大数据 1.2 哪里有大数据 1.3 什么是大数据分析 1.4 大数据分析的过程、技术与难点 1.5 全书概览 小结 习题 第2章 大数据分析模型 2.1 大数据分析模型建立方法 2.2 基本统计量 2.2.1 全表统计量 2.2.2 皮尔森相关系数 2.3 推断统计 2.3.1 参数估计 2.3.2 假设检验 2.3.3 假设检验的阿里云实现 小结 习题 第3章 关联分析模型 3.1 回归分析 3.1.1 回归分析概述 3.1.2 回归模型的拓展 3.1.3 回归的阿里云实现 3.2 关联规则分析 3.3 相关分析 小结 习题 第4章 分类分析模型 4.1 分类分析的定义 4.2 判别分析的原理和方法 4.2.1 距离判别法 4.2.2 Fisher判别法 4.2.3 贝叶斯判别法 4.3 基于机器学习分类的模型 4.3.1 支持向量机 4.3.2 逻辑回归 4.3.3 决策树与回归树 4.3.4 k近邻 4.3.5 随机森林 4.3.6 朴素贝叶斯 4.4 分类分析实例 4.4.1 二分类实例 4.4.2 多分类实例 小结 习题 第5章 聚类分析模型 5.1 聚类分析的定义 5.1.1 基于距离的亲疏关系度量 5.1.2 基于相似系数的相似性度量 5.1.3 个体与类以及类间的亲疏关系度量 5.1.4 变量的选择与处理 5.2 聚类分析的分类 5.3 聚类有效性的评价 5.4 聚类分析方法概述 5.5 聚类分析的应用 5.6 聚类分析的阿里云实现 小结 习题 第6章 结构分析模型 6.1 最短路径 6.2 链接排名 6.3 结构计数 6.4 结构聚类 6.5 社团发现 6.5.1 社团的定义 6.5.2 社团的分类 6.5.3 社团的用途 6.5.4 社团的数学定义 6.5.5 基于阿里云的社团发现 小结 习题 第7章 文本分析模型 7.1 文本分析模型概述 7.2 文本分析方法概述 7.2.1 Sp itWord 7.2.2 词频统计 7.2.3 TF-IDF 7.2.4 P DA 7.2.5 Word2Vec 小结 习题 第8章 大数据分析的数据预处理 8.1 数据抽样和过滤 8.1.1 数据抽样 8.1.2 数据过滤 8.1.3 基于阿里云的抽样和过滤实现 8.2 数据标准化与归一化 8.3 数据清洗 8.3.1 数据质量概述 8.3.2 缺失值填充 8.3.3 实体识别与真值发现 8.3.4 错误发现与修复 小结 习题 第9章 降维 9.1 特征工程 9.1.1 特征工程概述 9.1.2 特征变换 9.1.3 特征选择 9.1.4 特征重要性评估 9.2 主成分分析 9.2.1 什么是主成分分析 9.2.2 主成分分析的计算过程 9.2.3 基于阿里云的主成分分析 9.2.4 主成分的表现度量 9.3 因子分析 9.3.1 因子分析概述 9.3.2 因子分析的主要分析指标 9.3.3 因子分析的计算方法 9.4 压缩感知 9.4.1 什么是压缩感知 9.4.2 压缩感知的具体模型 9.5 面向神经网络的降维 9.5.1 面向神经网络的降维方法概述 9.5.2 如何利用神经网络降维 9.6 基于特征散列的维度缩减 9.6.1 特征散列方法概述 9.6.2 特征散列算法 9.7 基于asso算法的降维 9.7.1 asso方法简介 9.7.2 asso方法 9.7.3 asso算法的适用情景 小结 习题 第10章 面向大数据的数据仓库系统 10.1 数据仓库概述 10.1.1 数据仓库的基本概念 10.1.2 数据仓库的内涵 10.1.3 数据仓库的基本组成 10.1.4 数据仓库系统的体系结构 10.1.5 数据仓库的建立 10.2 分布式数据仓库系统 10.2.1 基于Hadoop的数据仓库系统 10.2.2 Shark:基于Spark的数据仓库系统 10.2.3 Mesa 10.3 内存数据仓库系统 10.3.1 SAP HANA 10.3.2 HyPer 10.4 阿里云数据仓库简介 小结 习题 第11章 大数据分析算法 11.1 大数据分析算法概述 11.2 回归算法 11.3 关联规则挖掘算法 11.4 分类算法 11.4.1 二分类算法 11.4.2 多分类算法 11.5 聚类算法 11.5.1 k-means算法 11.5.2 C ARANS算法 小结 习题 第12章 大数据计算平台 12.1 Spark 12.1.1 Spark简介 12.1.2 基于Spark的大数据分析实例 12.2 Hyracks 12.2.1 Hyracks简介 12.2.2 基于Hyracks的大数据分析实例 12.3 DPark …… 第13章 流式计算平台 第14章 大图计算平台 第15章 社交网络 第16章 推荐系统 参考文献 附录
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网