您好,欢迎来到聚文网。 登录 免费注册
数据流机器学习(MOA实例)/智能科学与技术丛书

数据流机器学习(MOA实例)/智能科学与技术丛书

  • 字数: 120
  • 出版社: 机械工业
  • 作者: (法)阿尔伯特·比费特//(西班牙)理查德·戈华达//(新西兰)杰弗里·福尔摩斯//伯恩哈德·普法林格|译者:陈瑶//姚毓夏
  • 商品条码: 9787111641391
  • 版次: 1
  • 开本: 16开
  • 页数: 212
  • 出版年份: 2020
  • 印次: 1
定价:¥79 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
这本书首先简要介绍了机器学习的主题,涵盖了大数据挖掘、数据流挖掘的基本方法,以及一个简单的MOA示例。接下来进行更详细的讨论,其中有关于草图技术、变更、分类、集成方法、回归、聚类和频繁模式挖掘的章节。这些章节中的大部分内容包括练习、基于MOA的实验,或者两者都有。*后,本书讨论了MOA软件,涵盖了MOA图形用户界面、命令行、其API的使用以及MOA中新方法的开发。对于那些想要使用数据流挖掘作为工具的读者、数据流挖掘的研究人员,以及想要为MOA创建新算法的程序员来说,这本书将是一个重要的参考。
目录
译者序 前言 第一部分 概述 第1章 简介2 1.1 大数据2 1.1.1 工具:开源革命4 1.1.2 大数据带来的挑战4 1.2 实时分析6 1.2.1 数据流6 1.2.2 时间和内存6 1.2.3 应用一览6 1.3 关于本书7 第2章 大数据流挖掘8 2.1 算法8 2.2 分类算法9 2.2.1 如何在数据流中评估分类器10 2.2.2 多数类分类器11 2.2.3 无变化分类器11 2.2.4 惰性分类器11 2.2.5 朴素贝叶斯分类器12 2.2.6 决策树分类器12 2.2.7 集成分类器13 2.3 回归算法13 2.4 聚类算法14 2.5 频繁模式挖掘14 第3章 MOA的实际操作介绍16 3.1 入门开始16 3.2 分类模型的图形用户界面18 3.3 用命令行操作23 第二部分 数据流挖掘 第4章 数据流和Sketch数据结构26 4.1 背景知识:近似算法27 4.2 集中不等式28 4.3 取样30 4.4 统计总数31 4.5 去重统计32 4.5.1 线性计数33 4.5.2 科恩对数计数器33 4.5.3 Flajolet-Martin计数器和HyperLogLog算法34 4.5.4 应用:图论的计算距离函数36 4.5.5 讨论:对数与线性37 4.6 频率问题37 4.6.1 SpaceSaving sketch38 4.6.2 CM-Sketch算法40 4.6.3 CountSketch算法42 4.6.4 时刻计算44 4.7 滑动窗口的指数矩形图45 4.8 分布式sketch计算的可合并性47 4.9 一些技术方面的讨论和其他资料48 4.9.1 哈希函数48 4.9.2 创建(, )近似算法49 4.9.3 其他sketch技术49 4.10 练习50 第5章 处理变化52 5.1 数据流中变化的定义52 5.2 评估器56 5.2.1 滑动窗口和线性评估器57 5.2.2 指数加权移动平均评估器57 5.2.3 单维度卡尔曼滤波器58 5.3 变化探测58 5.3.1 评估变化探测59 5.3.2 CUSUM测试和Page-Hinkley测试59 5.3.3 统计测试60 5.3.4 漂移探测法61 5.3.5 自适应滑动窗口算法62 5.4 与其他Sketch和多维数据结合64 5.5 练习64 第6章 分类66 6.1 分类器评估67 6.1.1 误差估算68 6.1.2 分布评估69 6.1.3 性能的评估测量70 6.1.4 统计显著性72 6.1.5 测量挖掘成本73 6.2 基线分类器73 6.2.1 多数类73 6.2.2 无变化分类器74 6.2.3 朴素贝叶斯74 6.2.4 多项式朴素贝叶斯77 6.3 决策树78 6.3.1 估算切分标准79 6.3.2 Hoeffding决策树80 6.3.3 CVFDT82 6.3.4 VFDTc和UFFT83 6.3.5 Hoeffding适应树84 6.4 处理数字属性85 6.4.1 VFML85 6.4.2 穷举二叉树86 6.4.3 Greenwald和 Khanna的分位数摘要86 6.4.4 高斯近似87 6.5 感知器模型88 6.6 惰性学习89 6.7 多标签分类器89 6.8 主动学习91 6.8.1 随机策略92 6.8.2 固定不确定策略93 6.8.3 可变不确定策略93 6.8.4 随机不确定策略94 6.9 概念演变94 6.10 MOA实战操作95 第7章 集成方法99 7.1 准确率加权集成99 7.2 加权多数算法100 7.3 堆叠算法102 7.4 装袋算法102 7.4.1 在线装袋算法103 7.4.2 装袋算法如何应对数据流变化103 7.4.3 杠杆装袋算法103 7.5 提升算法104 7.6 Hoeffding树集成算法105 7.6.1 Hoeffding选项树算法105 7.6.2 随机森林算法105 7.6.3 有限的Hoeffding树的感知器堆叠106 7.6.4 自适应大小的Hoeffding树算法107 7.7 重复性概念107 7.8 MOA实战操作108 第8章 回归110 8.1 什么是回归110 8.2 如何评估回归111 8.3 感知器学习112 8.4 惰性学习112 8.5 决策树学习112 8.6 决策规则113 8.7 MOA中的回归114 第9章 聚类115 9.1 聚类的评估方法116 9.2 k-means算法117 9.3 BIRCH、BICO和CluStream118 9.4 基于密度的方法: DBSCAN和Den-Stream120 9.5 ClusTree121 9.6 StreamKM++:核心集122 9.7 延伸阅读123 9.8 MOA实战操作124 第10章 频繁模式挖掘127 10.1 什么是模式挖掘127 10.1.1 模式的定义和例子127 10.1.2 频繁模式挖掘的批量算法129 10.1.3 闭合模式和最大模式131 10.2 数据流中频繁模式挖掘的方法131 10.3 如何在数据流中进行频繁项集挖掘134 10.3.1 简化为高频繁项134 10.3.2 Moment算法135 10.3.3 频繁模式数据流算法135 10.3.4 IncMine算法136 10.4 数据流的频繁子图挖掘137 10.4.1 WinGraphMiner框架138 10.4.2 AdaGraphMiner框架139 10.5 延伸阅读140 10.6 练习141 第三部分 MOA软件 第11章 MOA及其软件体系144 11.1 MOA架构145 11.2 安装145 11.3 MOA的近期发展145 11.4 MOA扩展包146 11.5 ADAMS优化147 11.6 MEKA优化149 11.7 OpenML环境150 11.8 StreamDM软件150 11.9 Streams工具151 11.10 Apache SAMOA 流媒体ML库151 第12章 图形用户界面154 12.1 初识图形用户界面154 12.2 分类和回归154 12.2.1 主要任务一览156 12.2.2 数据源和数据生成器157 12.2.3 贝叶斯分类器一览160 12.2.4 决策树一览160 12.2.5 元分类器(集成)一览161 12.2.6 函数分类器一览162 12.2.7 漂移分类器一览162 12.2.8 主动学习分类器163 12.3 聚类163 12.3.1 数据源和数据生成器163 12.3.2 数据流聚类算法一览163 12.3.3 如何进行可视化和数据分析164 第13章 用命令行操作166 13.1 给分类和回归创建学习任务166 13.2 给分类和回归创建评估任务167 13.3 给分类和回归创建学习与评估任务167 13.4 两种分类器的对比168 第14章 调用API170 14.1 MOA对象170 14.2 选项170 14.3 示例:先序评估173 第15章 在MOA中开发新的方法175 15.1 MOA中的主要类175 15.2 创建新的分类器176 15.3 编译分类器183 15.4 MOA中的良好编程方法183 参考文献185

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网