您好,欢迎来到聚文网。 登录 免费注册
数据陷阱 不可不知的数据处理、分析和可视化错误

数据陷阱 不可不知的数据处理、分析和可视化错误

  • 字数: 205000
  • 装帧: 平装
  • 出版社: 中国人民大学出版社
  • 作者: (美)本·琼斯
  • 出版日期: 2022-11-01
  • 商品条码: 9787300310633
  • 版次: 1
  • 开本: 16开
  • 页数: 264
  • 出版年份: 2022
定价:¥99 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
数据会说谎?小心那些我们在不知不觉中陷入的数据陷阱! 如果你曾经分析、处理过数据,那或许有过这样的经历: 你正在进行一场重要的演讲,你的数据深入而有见地,图表无可挑剔,并符合完美标准,你做出结论的推理过程无懈可击。然而在演讲的最后一刻,有人出来踢馆,指出你所使用的数据库有着根本性的错误,瞬间拆了你的台…… 数据陷阱的可怕之处在于,它们可能成就或破坏我们的数据工作,而我们却时常对它们视而不见。对于数据工作者来说,根本不存在从未掉入数据陷阱之人。随着数据被越来越广泛地应用,数据陷阱的危害也日益凸显。 因此,作者在本书中为我们梳理总结了数据工作者最容易掉入的七大数据陷阱,并给出了应对之策,教会我们如何避免在处理数据时出现尴尬、代价高昂的错误,并做到对数据细节的洞察和对数据陷阱的巧妙应对,从而使我们从数据中获得最准确可靠的信息,并最终在实践应用中实现从数据到价值的转化。
内容简介
7大数据陷阱的干货总结与避坑锦囊,教会数据工作者如何在数据陷阱中迅速恢复,避免踩雷。
数据陷阱无处不在,任何处理过数据的人都会在不知不觉中多次陷入其中。我们大多数人都还没有学会如何使用现代工具和所掌握的数据类型,从而导致了一些本可以轻易避免的常见的错误。
在本书中,作者为我们展示了以下七种在数据处理过程中常见的数据陷阱:
陷阱 1:认知误差——我们如何看待数据;
陷阱 2:技术陷阱——我们如何对数据进行处理;
陷阱 3:数学失误——我们如何对数据进行计算;
陷阱 4:统计疏忽——我们如何对数据进行比较;
陷阱 5:分析偏差——我们如何对数据进行分析;
陷阱 6:绘图乌龙——我们如何对数据进行可视化;
陷阱 7:设计风险——我们如何对数据进行修饰。
同时也向我们展示了这些数据陷阱是如何产生、如何变得如此常见的,指导我们如何从一开始就避免它们,并针对上述数据陷阱,提供了与之相对应的真实示例,以及数据可视化的实用指导。阅读本书,你将:
·深入了解随着我们对数据的依赖而增长的“数据与现实的差距”;
·了解如何使用正确的工具简化可视化过程;
·避免数据分析、可视化和演示中的常见错误;
·创建并呈现清晰、准确、有效的数据可视化。
作者简介
本·琼斯 Data Literacy公司创始人兼首席执行官,在华盛顿大学连续学院教授数据可视化。著有《用Tableau交流数据》(Communicating Data with Tableau)和《数据素养的17个关键特征》(17 Key Traits of Data Literacy)。凭借20多年的机械工程师、持续改进项目负责人和导师以及商业智能营销人员的工作经验,他学到很多关于处理数据时应该做什么和不应该做什么的知识。 ◆ 译者简介 陈天皓 工商管理和信息技术双硕士,项目管理专业人士。曾译有《商业仪表盘可视化解决方案》《人类未来进化史》等书,长期关注科技发展趋势与数据应用领域。 段力鲡 香港城市大学统计学硕士,深耕大数据挖掘与分析领域,曾分别于英国保诚(亚洲总部)、平安寿险总部担任数据科学家。现就职于沃尔玛中国,担任商业分析经理。 步凡 北京大学数学科学学院本科,美国杜克大学统计学博士。现任美国加州大学洛杉矶分校(UCLA)博士后研究员。主要研究方向为贝叶斯统计、随机过程模型、传染病动力模型等。
目录
第1章七类数据陷阱/1
七种特定类型的数据陷阱/5
避免七种数据陷阱/9
“我掉进陷阱里,爬不出来了”/10
第2章陷阱1:认知误差/13
我们如何看待数据/15
陷阱1A:数据与现实的差距/16
陷阱1B:过度依赖手工的数据/26
陷阱1C:前后矛盾的评分/34
陷阱1D:黑天鹅陷阱/42
陷阱1E:可证伪性与上帝陷阱/45
避免天鹅陷阱和上帝陷阱/47
第3章陷阱2:技术陷阱/51
我们如何对数据进行处理/53
陷阱2A:脏数据/54
陷阱2B:糟糕的混合和连接/73
第4章陷阱3:数学失误/77
我们如何对数据进行计算/79
陷阱3A:多重汇总/80
陷阱3B:缺失值/86
陷阱3C:汇总数/91
陷阱3D:荒谬的百分比/96
陷阱3E:不匹配的单位/102
第5章陷阱4:统计疏忽/107
我们如何对数据进行比较/109
陷阱4A:描述性错误/111
陷阱4B:推断陷阱/131
陷阱4C:狡猾的抽样/135
陷阱4D:对样本量不敏感/142
第6章陷阱5:分析偏差/147
我们如何对数据进行分析/149
陷阱5A:错误地认为直觉和分析相互对立/150
陷阱5B:浮夸的外推/158
陷阱5C:欠考虑的插值/163
陷阱5D:不靠谱的预测/166
陷阱5E:不过脑子的衡量指标/168
第7章陷阱6:绘图乌龙/175
我们如何对数据进行可视化/177
陷阱6A:棘手的图表/179
陷阱6B:数据教条主义/204
陷阱6C:错误地认为“很优”和“满意”相互对立/209
第8章陷阱7:设计风险/215
我们如何对数据进行修饰/217
陷阱7A:令人困惑的颜色/219
陷阱7B:遗漏的机会/224
陷阱7C:可用性/230
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网