您好,欢迎来到聚文网。 登录 免费注册
数据挖掘/大数据系列丛书

数据挖掘/大数据系列丛书

  • 字数: 350
  • 出版社: 清华大学
  • 作者: 编者:蔡毅//黄清宝//许可//王国华//伍慰珍|责编:郭赛
  • 商品条码: 9787302634256
  • 版次: 1
  • 开本: 16开
  • 页数: 222
  • 出版年份: 2023
  • 印次: 1
定价:¥44.5 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
近年来,数据挖掘 (Data Mining)引起了产 业界的极大关注,主要原因 是生产制造等环节中存在海 量有潜在价值的数据,而各 行各业都迫切需要将这些数 据转换成有用的信息和知识 。这些信息和知识可以广泛 用于各种领域,包括商务管 理、生产控制、市场分析、 工程设计等,帮助企业创造 更高的利润和占据新的制高 点。 本书内容新颖,可操作 性强,图文并茂,简明易懂 ,可作为高等学校数据科学 与大数据、软件工程等计算 机相关专业和信息管理类专 业“大数据开发技术”课程的 教材,也可作为大数据技术 培训班的教材,还适合大数 据技术研发人员和广大计算 机爱好者自学使用。
目录
第1章 绪论 1.1 数据挖掘概述 1.2 数据挖掘的定义 1.2.1 数据挖掘的一般步骤 1.2.2 数据挖掘任务 1.3 数据挖掘的主要问题 1.3.1 数据挖掘算法的有效性和可扩展性 1.3.2 处理噪声和不完全数据 1.3.3 高维度数据 1.3.4 关系数据库和复杂数据类型的处理 1.3.5 异种数据库和全球信息系统挖掘信息 1.4 数据挖掘的应用 1.4.1 推荐系统 1.4.2 互联网风险控制 1.5 小结 1.6 参考文献 第2章 数据及数据集基本分析 2.1 数据对象与属性 2.1.1 属性的定义 2.1.2 定性属性 2.1.3 定量属性 2.2 数据与元数据 2.2.1 传统的元数据 2.2.2 元数据的类型 2.2.3 元数据的模式 2.3 结构化、非结构化和半结构化数据 2.3.1 结构化数据 2.3.2 非结构化数据 2.3.3 半结构化数据 2.4 数据集基本分析技术 2.4.1 频率和众数 2.4.2 百分位数 2.4.3 均值和中位数 2.4.4 极差和方差 2.4.5 多元数据统计 2.5 结构化数据集基本分析技术 2.5.1 鸢尾花数据集介绍 2.5.2 描述统计 2.6 文本数据集基本分析技术 2.6.1 20newsgroups数据集介绍 2.6.2 文本可视化 2.7 数据可视化技术 2.7.1 可视化数据变量之间的相关性 2.7.2 可视化数据变量值的分布情况 2.8 数据对象相似性与距离计算 2.8.1 数据对象的相似性定义 2.8.2 数据对象相似性的度量方法 2.9 大数据概述 2.9.1 大数据的兴起 2.9.2 大数据的特点

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网