您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
零基础学大数据算法
字数: 379千字
装帧: 简装
出版社: 电子工业出版社
作者: 王宏志 著
出版日期: 2016-06-01
商品条码: 9787121289378
版次: 1
开本: 其他
页数: 268
出版年份: 2016
定价:
¥59
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书是通俗易懂的大数据算法教程。通篇采用师生对话的形式,旨在用通俗的语言、轻松的气氛,帮助读者理解大数据计算领域中的基础算法和思想。本书由背景篇、理论篇、应用篇和实践篇四部分组成。背景篇介绍大数据、算法、大数据算法等基本概念和背景;理论篇介绍解决大数据问题的亚线性算法、磁盘算法、并行算法、众包算法的基本思想和理论知识;应用篇介绍与大数据问题息息相关的数据挖掘和推荐系统的相关知识;实践篇从实际应用出发,引导读者动手操作,帮助读者通过实际程序和实验验证磁盘算法、并行算法和众包算法。在讲解每一个大数据问题之前,本书都会介绍大量的经典算法和基础数据结构知识,不仅可以帮助学习过数据结构与算法、算法设计与分析等课程的同学复习,同时能够让入门的“小菜鸟”们,不会因为没有学习过经典算法而对本书望而却步,轻松地掌握大数据算法!
作者简介
王宏志,哈尔滨工业大学计算机科学与技术学院教授、博士生导师。其研究方向为大数据管理与分析、数据质量、图数据管理。发表学术论文170余篇,出版学术专著两本,出版靠前首部《大数据算法》教材,其论文被SCI/EI检索110余次,他引500余次,其中7篇论文发表于很好靠前会议上。获得微软学者、IBM博士英才等称号,先后主持国家自然科学基金重点项目、国家支撑计划课题、国家博士后特别资助等10余个项目,还参加了国家973项目、863项目、自然科学基金重点项目等多个项目。他担任4个靠前期刊的编委,现任CCF哈尔滨分部秘书长、ACMSIGMOD中国秘书长、中国计算机学会学术工作委员会委员、CCF不错会员、中国数据库专业委员会委员、中国大数据专家委员会通信委员、中国计算机应用专业委员会委员。
林可,现效力于哈尔滨工业大学计算机系海量数据研究中心,前支教教师。从事海量数据计算、分布式系统、感知系统等方面的研究,有着丰富的研究和项目经验,爱技术也爱生活的文艺极客范儿,也是一位在大数据新天地中展翅欲飞的后生。
目录
目 录 篇 背景篇 章 何谓大数据 4 1.1 身边的大数据 4 1.2 大数据的特点和应用 6 第2 章 何谓算法 8 2.1 算法的定义 8 2.2 算法的分析 14 2.3 基础数据结构――线性表 24 2.4 递归――以阶乘为例 28 第3 章 何谓大数据算法 31 第2 篇 理论篇 第4 章 窥一斑而见全豹――亚线性算法 34 4.1 亚线性算法的定义 34 4.2 空间亚线性算法 35 4.2.1 水库抽样 35 4.2.2 数据流中的频繁元素 37 4.3 时间亚线性计算算法 40 4.3.1 图论基础回顾 40 4.3.2 平面图直径 45 4.3.3 最小生成树 46 4.4 时间亚线性判定算法 53 4.4.1 全0 数组的判定 53 4.4.2 数组有序的判定 55 第5 章 价钱与性能的平衡――磁盘算法 58 5.1 磁盘算法概述 58 5.2 外排序 62 5.3 外存数据结构――磁盘查找树 71 5.3.1 二叉搜索树回顾 71 5.3.2 外存数据结构――B 树 78 5.3.3 高维外存查找结构――KD 树 80 5.4 表排序 83 5.5 表排序的应用 86 5.5.1 欧拉回路技术 86 5.5.2 父子关系判定 87 5.5.3 前序计数 88 5.6 时间前向处理技术 90 5.7 缩图法 98 第6 章 1+1>2――并行算法 103 6.1 MapReduce 初探 103 6.2 MapReduce 算法实例 106 6.2.1 字数统计 106 6.2.2 平均数计算 108 6.2.3 单词共现矩阵计算 111 6.3 MapReduce 进阶算法 115 6.3.1 join 操作 115 6.3.2 MapReduce 图算法概述 122 6.3.3 基于路径的图算法 125 第7 章 超越MapReduce 的并行计算 131 7.1 MapReduce 平台的局限 131 7.2 基于图处理平台的并行算法 136 7.2.1 概述 136 7.2.2 BSP 模型下的单源最短路径 137 7.2.3 计算子图同构 141 第8 章 众人拾柴火焰高――众包算法 144 8.1 众包概述 144 8.1.1 众包的定义 144 8.1.2 众包应用举例 146 8.1.3 众包的特点 149 8.2 众包算法例析 152 第3 篇 应用篇 第9 章 大数据中有黄金――数据挖掘 158 9.1 数据挖掘概述 158 9.2 数据挖掘的分类 159 9.3 聚类算法――k-means 160 9.4 分类算法――Naive Bayes 166 0 章 推荐系统 170 10.1 推荐系统概述 170 10.2 基于内容的推荐方法 173 10.3 协同过滤模型 176 第4 篇 实践篇 1 章 磁盘算法实践 186 2 章 并行算法实践 194 12.1 Hadoop MapReduce 实践 194 12.1.1 环境搭建 194 12.1.2 配置Hadoop 201 12.1.3 “Hello World”程序―― WordCount 203 12.1.4 Hadoop 实践案例――记录去重 213 12.1.5 Hadoop 实践案例――等值连接 216 12.1.6 多机配置 221 12.2 适于迭代并行计算的平台――Spark 224 12.2.1 Spark 初探 224 12.2.2 单词出现行计数 230 12.2.3 在Spark 上实现WordCount 236 12.2.4 在HDFS 上使用Spark 241 12.2.5 Spark 的核心操作――Transformation 和Action 244 12.2.6 Spark 实践案例――PageRank 247 3 章 众包算法实践 251 13.1 认识AMT 251 13.2 成为众包工人 252
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网