您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
数据挖掘导论(原书第2版)
字数: 260
装帧: 简装
出版社: 机械工业出版社
作者: [美]陈封能(Pang-Ning Tan)等
出版日期: 2019-08-01
商品条码: 9787111631620
版次: 1
开本: 16开
页数: 480
出版年份: 2019
定价:
¥139
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书所涵盖的主题包括:数据预处理、预测建模、关联分析、聚类分析、异常检测和避免错误发现。通过介绍每个主题的基本概念和算法,为读者提供将数据挖掘应用于实际问题所需的必要背景。
作者简介
陈封能(Pang-Ning Tan)密歇根州立大学计算机科学与工程系教授,主要研究方向是数据挖掘、数据库系统、网络空间安全、网络分析等。
目录
出版者的话译者序前言第1章 绪论1 1.1 什么是数据挖掘2 1.2 数据挖掘要解决的问题3 1.3 数据挖掘的起源4 1.4 数据挖掘任务5 1.5 本书组织结构7 文献注释8 参考文献10 习题12第2章 数据14 2.1 数据类型15 2.1.1 属性与度量16 2.1.2 数据集的类型19 2.2 数据质量24 2.2.1 测量和数据收集问题24 2.2.2 关于应用的问题27 2.3 数据预处理28 2.3.1 聚集28 2.3.2 抽样30 2.3.3 维归约31 2.3.4 特征子集选择32 2.3.5 特征创建34 2.3.6 离散化和二元化35 2.3.7 变量变换38 2.4 相似性和相异性的度量40 2.4.1 基础40 2.4.2 简单属性之间的相似度和相异度41 2.4.3 数据对象之间的相异度42 2.4.4 数据对象之间的相似度44 2.4.5 邻近度度量的例子44 2.4.6 互信息50 * 2.4.7 核函数51 * 2.4.8 Bregman散度53 2.4.9 邻近度计算问题54 2.4.10 选择正确的邻近度度量56 文献注释56 参考文献58 习题60第3章 分类:基本概念和技术65 3.1 基本概念65 3.2 一般的分类框架67 3.3 决策树分类器69 3.3.1 构建决策树的基本算法70 3.3.2 表示属性测试条件的方法71 3.3.3 选择属性测试条件的方法73 3.3.4 决策树归纳算法79 3.3.5 示例:Web机器人检测79 3.3.6 决策树分类器的特征81 3.4 模型的过拟合85 3.5 模型选择90 3.5.1 验证集应用90 3.5.2 模型复杂度合并91 3.5.3 统计范围估计93 3.5.4 决策树的模型选择94 3.6 模型评估95 3.6.1 保持方法95 3.6.2 交叉验证96 3.7 超参数的使用97 3.7.1 超参数选择98 3.7.2 嵌套交叉验证98 3.8 模型选择和评估中的陷阱99 3.8.1 训练集和测试集之间的重叠99 3.8.2 使用验证错误率作为泛化错误率100 * 3.9 模型比较100 3.9.1 估计准确率的置信区间100 3.9.2 比较两个模型的性能101 文献注释102 参考文献105 习题108第4章 分类:其他技术114 4.1 分类器的种类114 4.2 基于规则的分类器115 4.2.1 基于规则的分类器原理116 4.2.2 规则集的属性116 4.2.3 规则提取的直接方法117 4.2.4 规则提取的间接方法120 4.2.5 基于规则的分类器的特点121 4.3 最近邻分类器122 4.3.1 算法123 4.3.2 最近邻分类器的特点124 4.4 朴素贝叶斯分类器124 4.4.1 概率论基础125 4.4.2 朴素贝叶斯假设127 4.5 贝叶斯网络132 4.5.1 图表示132 4.5.2 推理与学习135 4.5.3 贝叶斯网络的特点139 4.6 logistic回归140 4.6.1 logistic回归用作广义线性模型141 4.6.2 学习模型参数141 4.6.3 logistic回归模型的特点142 4.7 人工神经网络143 4.7.1 感知机144 4.7.2 多层神经网络146 4.7.3 人工神经网络的特点150 4.8 深度学习151 4.8.1 使用协同损失函数151 4.8.2 使用响应激活函数153 4.8.3 正则化154 4.8.4 模型参数的初始化155 4.8.5 深度学习的特点157 4.9 支持向量机158 4.9.1 分离超平面的边缘158 4.9.2 线性SVM159 4.9.3 软边缘SVM162 4.9.4 非线性SVM165 4.9.5 SVM的特点167 4.10 组合方法168 4.10.1 组合方法的基本原理168 4.10.2 构建组合分类器的方法169 4.10.3 偏置方差分解170 4.10.4 装袋171 4.10.5 提升173 4.10.6 随机森林176 4.10.7 组合方法的实验比较177 4.11 类不平衡问题178 4.11.1 类不平衡的分类器构建179 4.11.2 带类不平衡的性能评估180 4.11.3 寻找很优的评分阈值183 4.11.4 综合评估性能183 4.12 多类问题188 文献注释189 参考文献193 习题198第5章 关联分析:基本概念和算法205 5.1 预备知识205 5.2 频繁项集的产生207 5.2.1 先验原理209 5.2.2 Apriori算法的频繁项集产生210 5.2.3 候选项集的产生与剪枝212 5.2.4 支持度计数215 5.2.5 计算复杂度217 5.3 规则的产生219 5.3.1 基于置信度的剪枝219 5.3.2 Apriori算法中规则的产生219 5.3.3 示例:美国国会投票记录221 5.4 频繁项集的紧凑表示221 5.4.1 极大频繁项集221 5.4.2 闭项集223 * 5.5 其他产生频繁项集的方法225 * 5.6 FP增长算法228 5.6.1 FP树表示法228 5.6.2 FP增长算法的频繁项集产生229 5.7 关联模式的评估231 5.7.1 兴趣度的客观度量232 5.7.2 多个二元变量的度量239 5.7.3 辛普森悖论240 5.8 倾斜支持度分布的影响241 文献注释244 参考文献248 习题256第6章 关联分析:高级概念263 6.1 处理
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网