您好,欢迎来到聚文网。 登录 免费注册
Spark机器学习进阶实战/大数据技术丛书

Spark机器学习进阶实战/大数据技术丛书

  • 出版社: 机械工业
  • 作者: 马海平//于俊//吕昕//向海
  • 商品条码: 9787111608103
  • 版次: 1
  • 开本: 16开
  • 页数: 210
  • 出版年份: 2018
  • 印次: 1
定价:¥59 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
科大讯飞大数据专家团队撰写,不囿于Spark机 器学习库,突出算法的工程化思维与实践。从基础 引出算法,从算法实践到场景应用,层层推进,分 享笔者的一些想法和见解,铺展开更为深入、全面 的思路。 6大机器学习模型构建 分类:刻画事物特征的类标识,有效预测未知 数据的归类情况。 聚类:根据相似程度生成对象集合,同集合相 似,不同集合相异。 回归:找出数据规律和趋势,预测数据未来变 化。 关联规则:挖掘关联关系,辅助商业决策。 协同过滤:刻画用户相似兴趣,实现偏好预测 。 降维:有效地消除无关和冗余特征,提升模型 精度。 5大典型应用场景 异常检测:有效解决入侵检测、欺诈检测、社 交假新闻等问题。 用户画像:高度精炼用户的特征标识,为产品 与决策提供数据支持和事实依据。 点击率预估:预估点击概率,计算点击收益, 选出收益最高的策略。 企业征信:提供信用信息服务,洞察企业信用 风险。 智慧交通:实现交通数据的价值,提供解决城 市交通问题的思路。 同时,马海平、于俊、吕昕、向海著的《Spark 机器学习进阶实战/大数据技术丛书》从《道德经》 和《庄子》精选名言,并结合大数据机器学习相关 内容,对名言加以讲解,引导大家以老庄的思想来 认识大数据的内涵。
作者简介
向海,科大讯飞大数据专家,spark爱好者,专注于大数据领域,现从事基于spark的用户行为分析相关工作。
目录
前言 第一篇 基础篇 第1章 机器学习概述 1.1 机器学习概述 1.1.1 理解大数据 1.1.2 机器学习发展过程 1.1.3 大数据生态环境 1.2 机器学习算法 1.2.1 传统机器学习 1.2.2 深度学习 1.2.3 其他机器学习 1.3 机器学习分类 1.3.1 监督学习 1.3.2 无监督学习 1.3.3 半监督学习 1.3.4 强化学习 1.4 机器学习综合应用 1.4.1 异常检测 1.4.2 用户画像 1.4.3 广告点击率预估 1.4.4 企业征信大数据应用 1.4.5 智慧交通大数据应用 1.5 本章小结 第2章 数据分析流程和方法 2.1 数据分析概述 2.2 数据分析流程 2.2.1 业务调研 2.2.2 明确目标 2.2.3 数据准备 2.2.4 特征处理 2.2.5 模型训练与评估 2.2.6 输出结论 2.3 数据分析的基本方法 2.3.1 汇总统计 2.3.2 相关性分析 2.3.3 分层抽样 2.3.4 假设检验 2.4 简单的数据分析实践 2.4.1 环境准备 2.4.2 准备数据 2.4.3 数据分析 2.5 本章小结 第二篇 算法篇 第3章 构建分类模型 第4章 构建聚类模型 第5章 构建回归模型 第6章 构建关联规则模型 第7章 协同过滤 第8章 数据降维 第三篇 综合应用篇

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网