您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
大数据湖最佳实践
字数: 282000
装帧: 平装
出版社: 中国电力出版社
作者: (美)亚历克斯·歌瑞克
出版日期: 2020-07-01
商品条码: 9787519845902
版次: 1
开本: 16开
页数: 240
出版年份: 2020
定价:
¥68
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
数据仓库、大数据、数据科学的简单介绍。
了解企业建立数据湖的各种途径。
探索如何构建自助服务模型,以及如何让分析师便捷访问数据的很好实践。
使用不同的方法来构建数据湖。
了解不同行业专家实现数据湖的方法。
作者简介
亚历克斯·歌瑞克(Alex Gorelik)是Waterline Data的首席技术官和创始人,也是三家初创公司的创始人。他曾经担任Informatica的数据质量部经理,负责管理公司的平台和数据集成技术。此外,他还曾是IBM的杰出工程师,也是Exeros和Acta Technology的联合创始人、首席技术官和工程副总裁。
目录
前言1
第1章数据湖概述7
数据湖的成熟度9
数据水洼11
数据池12
创建成功的数据湖12
适合的平台13
适合的数据14
适合的界面16
数据沼泽18
成功实施数据湖的路线图20
建立数据湖20
规划数据湖21
构建自助服务的数据湖23
构建数据湖28
云上数据湖29
逻辑数据湖29
小结34
第2章历史背景35
数据自助服务驱动——数据库的诞生36
分析必要性驱动——数据仓库的诞生39
数据仓库生态系统40
存储和查询数据41
加载数据——数据集成工具47
组织和管理数据51
消费数据57
小结58
第3章大数据和数据科学概述59
Hadoop引领大数据的历史性转变60
Hadoop文件系统60
MapReduce作业中计算和存储如何交互61
SchemaonRead63
Hadoop项目64
数据科学65
你的分析机构应该关注什么?67
机器学习71
可解释性72
变更管理73
小结74
第4章建立数据湖75
为什么是Hadoop75
防止数据水洼扩散78
利用大数据的优势79
以数据科学为先导80
策略1:迁移已有功能83
策略2:为新项目建立数据湖85
策略3:建立数据治理中心85
哪种策略最适合你?86
小结88
第5章从数据池/大数据仓库到数据湖89
数据仓库的基本功能90
用于分析的维度模型91
整合不同源的数据92
使用缓慢变化维保存历史记录93
数据仓库作为历史库的局限性93
迁移至数据池94
数据池中保存历史数据94
在数据池中使用缓慢变化维96
数据池演化为数据湖——加载数据仓库中未包含的数据98
原始数据98
外部数据99
IoT与其他流式数据102
实时数据湖103
Lambda架构105
数据转换106
目标系统108
数据仓库109
业务数据存储109
实时应用和数据产品110
小结111
第6章自助服务优化112
自助服务起源113
业务分析师115
发现和理解数据——企业数据归档116
建立信任119
数据预置126
为分析准备数据128
数据湖数据整理129
用Hadoop来准备数据129
数据预处理的常见案例130
分析和可视化133
自助式商业智能的新世界133
新的分析工作流134
门卫向店主的角色转变136
管理自助服务137
小结137
第7章数据湖架构139
规划数据湖139
原始区141
产品区142
工作区144
敏感区145
多数据湖146
保持各数据湖独立的优势147
合并多数据湖的优势147
云上数据湖148
虚拟数据湖151
数据联邦151
大数据虚拟化152
消除冗余154
小结156
第8章数据湖元数据157
组织数据157
技术元数据159
业务元数据164
打标166
自动编目167
逻辑数据管理169
敏感数据管理和访问控制169
数据质量170
连接分散的数据172
建立血缘关系174
数据预置176
创建目录的工具176
工具对比177
数据洋178
小结179
第9章数据访问控制180
授权与访问控制181
基于标签的控制策略182
数据脱敏186
数据主权与法规189
自助服务访问管理191
预置数据196
小结204
第10章行业案例205
金融服务大数据206
消费者、数字化和数据正在改变我们所熟知的金融行业206
拯救银行208
新数据提供新机遇212
使用数据湖的关键过程215
数据湖为金融服务领域带来的价值218
保险行业中的数据湖220
智慧城市222
医疗大数据224
作者介绍227
封面介绍227
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网