您好,欢迎来到聚文网。 登录 免费注册
大数据分析与计算

大数据分析与计算

  • 字数: 759
  • 出版社: 清华大学
  • 作者: 编者:汤羽//林迪//范爱华//吴薇薇
  • 商品条码: 9787302485865
  • 版次: 1
  • 开本: 16开
  • 页数: 485
  • 出版年份: 2018
  • 印次: 1
定价:¥89 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
大数据应用已成为行业热点和产业发展新增长点,数据科学与计算技术也是最新的前沿领域,其中,大数据计算分析提供了核心的技术支撑。本书从大数据计算系统的三个层次对数据模型、处理算法、计算模型与架构、开发技术标准等内容进行了综合性的介绍,重点阐述了各类数据分析算法和MapReduce,图并行计算,交互式处理,流计算,内存计算等计算架构。本书适合作为数据科学与大数据计算技术、计算机科学与技术、互联网应用系统、物联网工程等专业相关课程的教材。
作者简介
目录
第1章 绪论 1.1 数据与数据科学 1.2 大数据概念 1.3 大数据技术特征 参考文献 习题 第2章 大数据计算体系 2.1 大数据计算架构 2.2 数据存储系统 2.2.1 数据清洗与建模 2.2.2 分布式文件系统 2.2.3 NoSQL数据库 2.2.4 统一数据访问接口 2.3 数据处理平台 2.3.1 数据分析算法 2.3.2 计算处理模型 2.3.3 计算平台与引擎 2.4 数据应用系统 2.4.1 大数据应用领域 2.4.2 大数据解决方案 参考文献 习题 第3章 大数据标准与模式 3.1 大数据标准体系 3.2 大数据计算模式 参考文献 习题 第4章 数据采集方法 4.1 系统日志采集 4.1.1 日志采集的目的 4.1.2 日志采集过程 4.2 网络数据采集 4.2.1 网络爬虫工作原理 4.2.2 网页搜索策略 4.2.3 网页分析算法 4.2.4 网络爬虫框架 4.3 数据采集接口 参考文献 习题 第5章 数据清洗与规约方法 5.1 数据预处理研究现状 5.1.1 数据清洗的研究现状 5.1.2 数据规约的研究现状 5.2 数据质量问题分类 5.2.1 单数据源的问题 5.2.2 多数据源的问题 5.3 数据清洗技术 5.3.1 重复记录清洗 5.3.2 消除噪声数据 5.3.3 缺失值清洗

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网