您好,欢迎来到聚文网。 登录 免费注册
大数据技术(数据科学与大数据技术微课版面向新工科专业建设计算机系列教材)

大数据技术(数据科学与大数据技术微课版面向新工科专业建设计算机系列教材)

  • 字数: 528
  • 出版社: 清华大学
  • 作者: 编者:曹洁//孙玉胜|责编:白立军|总主编:张尧学
  • 商品条码: 9787302553632
  • 版次: 1
  • 开本: 16开
  • 页数: 356
  • 出版年份: 2020
  • 印次: 1
定价:¥59 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
\\\"本书系统地讲解了大数据处理常用技术,具体包括大数据处理架构Hadoop、分布式文件系统HDFS、MapReduce编程模型、分布式数据库Hbase、NoSQL数据库、Spark分布式内存计算、MapReduce应用开发、Spark SQL编程、数据可视化。本书编写特色理论与具体操作相结合,较低基础入门大数据技术。读者对象是本科、专科或研究生大数据技术课程教材,大数据技术爱好者,其他对大数据技术感兴趣的人员。 \\\"
作者简介
曹洁:男,郑州轻工业大学副教授,同济大学博士毕业。研究方向:数据分析、机器学习、并行分布式处理。近年在软件学报、电子学报、计算机研究与发展、通信学报等刊物上发表10余篇论文。
目录
第1章 大数据概述 1.1 大数据的基本概念 1.1.1 大数据的定义 1.1.2 大数据的特征 1.2 大数据技术 1.2.1 数据采集技术 1.2.2 数据预处理技术 1.2.3 云计算技术 1.2.4 分布式处理技术 1.2.5 数据存储技术 1.3 大数据计算模式与典型系统 1.3.1 批处理计算模式与典型系统 1.3.2 流式计算模式与典型系统 1.3.3 迭代计算模式与典型系统 1.3.4 图计算模式与典型系统 1.3.5 内存计算模式与典型系统 1.4 习题 第2章 大数据软件基础 2.1 Linux基础 2.1.1 命令格式 2.1.2 用户管理 2.1.3 文件操作 2.1.4 目录操作 2.1.5 文件压缩和解压缩命令 2.1.6 安装和卸载软件 2.1.7 主机名更改 2.2 Java语言基础 2.2.1 基本数据类型 2.2.2 主类结构 2.2.3 定义类 2.2.4 类的实例化 2.2.5 包 2.2.6 常用实用类 2.3 SQL基础 2.4 在VirtualBox上安装虚拟机 2.4.1 Master节点的安装 2.4.2 复制虚拟机 2.5 习题 第3章 Hadoop大数据处理架构 3.1 Hadoop概述 3.1.1 Hadoop简介 3.1.2 Hadoop特性 3.2 Hadoop生态系统 3.2.1 Hadoop分布式文件系统 3.2.2 MapReduce分布式计算模型 3.2.3 Hive数据仓库 3.2.4 HBase分布式数据库 3.2.5 Zookeeper分布式协调服务 3.2.6 Sqoop数据导人导出工具 3.2.7 Pig数据分析

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网