您好,欢迎来到聚文网。 登录 免费注册
重构大数据统计

重构大数据统计

  • 字数: 502.00千字
  • 装帧: 平装
  • 出版社: 电子工业出版社
  • 作者: 杨旭 著作
  • 出版日期: 2014-08-01
  • 商品条码: 9787121225000
  • 版次: 1
  • 开本: 16开
  • 页数: 392
  • 出版年份: 2014
定价:¥79 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
基于《重构大数据统计》内容开发的数据分析工具已经在阿里巴巴集团内部的多个部门使用,取得显著效果。大数据的统计计算是进行数据探索和分析挖掘的基础,在实际应用中会遇到两个问题:一个是需要使用多少资源;另一个是计算时间,它关系到数据探索分析的效率和效果。人们都希望花更少的钱,并且计算时间更短,但对于某个确定的计算过程,它们是成反比的。《重构大数据统计》就是从统计计算的算法入手,重构其计算过程,从而同时降低资源使用量和计算时间。《重构大数据统计》提出了一套完整的关于大数据统计的计算理论,包括常用的各种统计量和统计方法。《重构大数据统计》还提供大量的示例程序代码帮助读者进一步了解算法细节,便于将书中的方法运用于实际计算。
作者简介
杨旭,2004年获南开大学数学博士学位,之后在南开大学信息学院从事博士后研究工作。2006年加入微软亚洲研究院,进行符号计算、大规模矩阵计算及机器学习算法研究;2010年加入阿里巴巴,从事大数据相关的统计和机器学习算法研发。
目录
第1章基本概念 1
1.1 数据类型 1
1.2 总体和样本 2
1.3 参数和统计量 2
1.4 分布式计算 3
第2章单变量基本统计量 5
2.1 数量统计量 5
2.1.1 样本方差为何除以n-1 7
2.1.2 数据分布与标准差的关系 10
2.1.3 新的计算公式 11
2.1.4 代码实现 16
2.2 频数统计量 18
2.3 次序统计量 23
2.3.1 通过排序方法计算次序统计量 25
2.3.2 不需排序就可计算的次序统计量 29
2.3.3 基于频数信息计算次序统计量 31
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网