您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
特征工程的艺术 通用技巧与实用案例
字数: 279000
装帧: 平装
出版社: 人民邮电出版社
作者: (加)巴勃罗·迪布
出版日期: 2022-05-01
商品条码: 9787115588418
版次: 1
开本: 16开
页数: 212
出版年份: 2022
定价:
¥89.8
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
为改善机器学习模型的表现,你会花多少时间修改输入数据的特征?图灵奖得主Yoshua Bengio曾说:“好的输入特征是机器学习取得成功的基本条件。在产业化机器学习中,特征工程所占的工作量接近90%。”修改数据特征以更好地捕获问题的本质,这是机器学习的重中之重。 没有高深的领域知识能否进行高质量的特征工程?本书直面这一充满争议的话题,在不考虑领域知识的情况下,给出了特征工程的一些通用技巧。此外,本书还展示了丰富的案例,涵盖图数据、时间戳数据、文本数据和图像数据。你将在学习各种技巧和诀窍的过程中,逐渐领会特征工程的艺术。
内容简介
特征工程可以修改数据特征,更好地捕获问题本质,从而改进结果。这个过程既是一种艺术,也是技巧和诀窍的一种结合。本书是一本特征工程实用指南,主要探讨如何利用特征工程提升机器学习解决方案的性能。本书从特征工程的基本概念和技术开始介绍,建立了一种独特的跨领域方法,通过充分研究案例详细介绍了图数据、时间戳数据、文本数据和图像数据的处理方法,包括分箱、折外估计、特征选择、数据降维和可变长度数据编码等重要主题。
本书适合机器学习相关从业者和数据科学家阅读。
作者简介
巴勃罗·迪布(Pablo Duboue) NLP学者。2005年博士毕业于美国哥伦比亚大学,师从ACL前主席Kathleen McKeown教授,曾是IBM Watson DeepQA团队成员。2016年创办NLP技术公司Textualization。他有丰富的教学经验,是世界多所大学的访问教授。
目录
第一部分基础知识
第1章简介
1.1特征工程
1.2模型评价
1.2.1度量
1.2.2交叉验证
1.2.3士拟合
1.2.4维数灾难
1.3周期
1.3.1ML周期
1.3.2特征工程周期
1.4分析
1.4.1幂索性数据分析
1.4.2差分析
1.5其他过程
1.5.1域建模
1.5.2特征构建
1.6讨论
1.7扩展学习
第2章特征组合:归一化、离散化和异常值
2.1归一化特征
2.1.1标准化和去相关性
2.1.2平滑
2.1.3特征加权
2.2离散化和分箱
2.2.1无监督离散化
2.2.2督离散化
2.3描述性特征
2.3.1直方图
2.3.2其他描述性特征
2.4处理异常值
2.5高级技术
2.6扩展学习
第3章特征扩展:可计算特征、填充与核技巧
3.1可计算特征
3.2填充
3.3复杂特征分解
3.4核操作特征扩展
3.5扩展学习
第4章特征缩减:特征选择、降维和嵌入
4.1特征选择
4.1.1度量
4.1.2组成特征集:搜索与筛选
4.1.3高级技术
4.2正则化与嵌入式特征选择
4.2.1L2正则化:岭回归
4.2.2L1正则化:LASSO
4.2.3其他使用嵌入式特征选择的算法
4.3数据降维
4.3.1特征哈希
4.3.2随机投影
4.3.3奇异值分解
4.3.4隐狄利克雷分配
4.3.5聚类
4.3.6其他数据降维技术
4.3.7嵌入
4.4扩展学习
第5章高级主题:可变长度数据与自动特征工程
5.1可变长度特征向量
5.1.1集合
5.1.2列表
5.1.3树
5.1.4图
5.1.5时间序列
5.2基于实例的特征工程
5.3深度学习与特征工程
5.4自动特征工程
5.4.1特征学习
5.4.2无监督特征工程
5.5扩展学习
第二部分案例研究
第6章图数据
6.0本章概述
6.1WikiCities数据集
6.2探索性数据分析
6.3第一个特征集
6.4第二个特征集
6.5最终的特征集
6.6扩展学习
第7章时间戳数据
7.0本章概述
7.1WikiCities:历史特征
7.2时间延迟特征
7.2.1填充时间戳数据
7.2.2第一次特征化:填充二阶延迟数据
7.2.3误差分析
7.3滑动窗口
7.4第三次特征化:EMA
7.5使用历史数据进行扩展
7.5.1第四次特征化:扩展的数据
7.5.2讨磺
7.6时间序列
7.6.1WikiCountries数据集
7.6.2探索性数据分析
7.6.3第一次特征化:无TS特征
7.6.4第二次特征化:使用TS作为特征
7.6.5使用模型预测作为特征
7.6.6讨磺
7.7扩展学习
第8章文本数据
8.0本章概述
8.1WikiCities:文本
8.2探索性数据分析
8.3仅数值型记号
8.3.1词类型与记号
8.3.2分词:基础知识
8.3.3第一次特征化
8.4词袋
8.4.1分词
8.4.2第二次特征化
8.5停用词和形态学特征
8.5.1停用词
8.5.2分词:词干提取
8.5.3第三次特征化
8.6上下文特征
8.6.1二元词
8.6.2第四次特征化
8.7跳跃二元词与特征哈希
8.7.1跳跃二元词
8.7.2第五次特征化
8.8数据降维与嵌入
8.8.1嵌入
8.8.2特征加权:TF-IDF
8.8.3第六次特征化
8.9结束语
8.9.1内容扩展
8.9.2文本中的结构
8.10扩展学习
第9章图像数据
9.0本章概述
9.1WikiCities:卫星图像
9.2探索性数据分析
9.3像素即特征
9.3.1第一次特征化
9.3.2可计算特征:高斯模糊
9.3.3白化
9.3.4对变动的误差分析
9.4自动数据集扩展
9.4.1仿射变换
9.4.2第二次特征化
9.5描述性特征:直方图
9.6局部特征检测器:角点
9.6.1Harris角点检测
9.6.2第四次特征化
9.7数据降维:HOG
9.8结束语
9.9扩展学习
第10章其他领域:视频、GIS和偏好
10.1视频
10.1.1数据:屏幕录制
10.1.2关键帧检测
10.1.3目标跟踪:均值漂移
10.1.4扩展学习
10.2地理特征
10.3偏好
10.3.1数据:Linux核心代码提交
10.3.2填充偏好数据
10.3.3扩展学习
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网