您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
精通特征工程
字数: 254千字
装帧: 平装
出版社: 人民邮电出版社
作者: [美]爱丽丝·郑(Alice Zheng) 阿曼达·卡萨丽(Amanda Casari)
出版日期: 2019-04-01
商品条码: 9787115509680
版次: 1
开本: 16开
页数: 156
出版年份: 2019
定价:
¥59
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
特征工程是机器学习流程中至关重要的一个环节,然而专门讨论这个话题的著作却很少。本书旨在填补这一空白,着重阐明特征工程的基本原则,介绍大量特征工程技术,教你从原始数据中提取出正确的特征并将其转换为适合机器学习模型的格式,从而轻松构建模型,增强机器学习算法的效果。 然而,本书并非单纯地讲述特征工程的基本原则,而是通过大量示例和练习将重点放在了实际应用上。每一章都集中研究一个数据问题:如何表示文本数据或图像数据,如何为自动生成的特征降低维度,何时以及如何对特征进行标准化,等等。最后一章通过一个完整的例子演示了多种特征工程技术的实际应用。书中所有代码示例均是用Python编写的,涉及NumPy、Pandas、scikit-learn和Matplotlib等程序包。 - 数值型数据的特征工程:过滤、分箱、缩放、对数变换和指数变换 - 自然文本技术:词袋、n元词与短语检测 - 基于频率的过滤和特征缩放 - 分类变量编码技术:特征散列化与分箱计数 - 使用主成分分析的基于模型的特征工程 - 模型堆叠与k-均值特征化 - 图像特征提取:人工提取与深度学习
内容简介
本书介绍大量特征工程技术,阐明特征工程的基本原则。主要内容包括:机器学习流程中 的基本概念,数值型数据的基础特征工程,自然文本的特征工程,词频- 逆文档频率,高效的分类变量编码技术,主成分分析,模型堆叠,图像处理,等等。
作者简介
爱丽丝·郑(Alice Zheng) 亚马逊广告平台建模和优化团队负责人,应用机器学习、生成算法和平台开发领域的技术领dao者,前微软研究院机器学习研究员。 阿曼达·卡萨丽(Amanda Casari) 谷歌云开发者关系工程经理,曾是Concur Labs的产品经理和数据科学家,在数据科学、机器学习、复杂系统和机器人等多个领域都有丰富经验。
目录
前言 ix 第 1 章 机器学习流程 1 1.1 数据 1 1.2 任务 1 1.3 模型 2 1.4 特征 3 1.5 模型评价 3 第 2 章 简单而又奇妙的数值 4 2.1 标量、向量和空间 5 2.2 处理计数 7 2.2.1 二值化 7 2.2.2 区间量化(分箱) 9 2.3 对数变换 13 2.3.1 对数变换实战 16 2.3.2 指数变换:对数变换的推广 19 2.4 特征缩放/ 归一化 24 2.4.1 min-max 缩放 24 2.4.2 特征标准化/ 方差缩放 24 2.4.3 2 归一化 25 2.5 交互特征 28 2.6 特征选择 30 2.7 小结 31 2.8 参考文献 32 第3 章 文本数据:扁平化、过滤和分块 33 3.1 元素袋:将自然文本转换为扁平向量 34 3.1.1 词袋 34 3.1.2 n 元词袋 37 3.2 使用过滤获取清洁特征 39 3.2.1 停用词 39 3.2.2 基于频率的过滤 40 3.2.3 词干提取 42 3.3 意义的单位:从单词、n 元词到短语 43 3.3.1 解析与分词 43 3.3.2 通过搭配提取进行短语检测 44 3.4 小结 50 3.5 参考文献 51 第4 章 特征缩放的效果:从词袋到tf-idf 52 4.1 tf-idf:词袋的一种简单扩展 52 4.2 tf-idf 方法测试 54 4.2.1 创建分类数据集 55 4.2.2 使用tf-idf 变换来缩放词袋 56 4.2.3 使用逻辑回归进行分类 57 4.2.4 使用正则化对逻辑回归进行调优 58 4.3 深入研究:发生了什么 62 4.4 小结 64 4.5 参考文献 64 第5 章 分类变量:自动化时代的数据计数 65 5.1 分类变量的编码 66 5.1.1 one-hot 编码 66 5.1.2 虚拟编码 66 5.1.3 效果编码 69 5.1.4 各种分类变量编码的优缺点 70 5.2 处理大型分类变量 70 5.2.1 特征散列化 71 5.2.2 分箱计数 73 5.3 小结 79 5.4 参考文献 80 第6 章 数据降维:使用PCA 挤压数据 82 6.1 直观理解 82 6.2 数学推导 84 6.2.1 线性投影 84 6.2.2 方差和经验方差 85 6.2.3 主成分:第 一种表示形式 86 6.2.4 主成分:矩阵- 向量表示形式 86 6.2.5 主成分的通用解 86 6.2.6 特征转换 87 6.2.7 PCA 实现 87 6.3 PCA 实战 88 6.4 白化与ZCA 89 6.5 PCA 的局限性与注意事项 90 6.6 用例 91 6.7 小结 93 6.8 参考文献 93 第7 章 非线性特征化与k-均值模型堆叠 94 7.1 k-均值聚类 95 7.2 使用聚类进行曲面拼接 97 7.3 用于分类问题的k-均值特征化 100 7.4 优点、缺点以及陷阱 105 7.5 小结 107 7.6 参考文献 107 第8 章 自动特征生成:图像特征提取和深度学习 108 8.1 最简单的图像特征(以及它们因何失效) 109 8.2 人工特征提取:SIFT 和HOG 110 8.2.1 图像梯度 110 8.2.2 梯度方向直方图 113 8.2.3 SIFT 体系 116 8.3 通过深度神经网络学习图像特征 117 8.3.1 全连接层 117 8.3.2 卷积层 118 8.3.3 ReLU 变换 122 8.3.4 响应归一化层 123 8.3.5 池化层 124 8.3.6 AlexNet 的结构 124 8.4 小结 127 8.5 参考文献 128 第9 章 回到特征:建立学术论文推荐器 129 9.1 基于项目的协同过滤 129 9.2 第 一关:数据导入、清理和特征解析 130 9.3 第二关:更多特征工程和更智能的模型 136 9.4 第三关:更多特征= 更多信息 141 9.5 小结 144 9.6 参考文献 144 附录A 线性建模与线性代数基础 145 A.1 线性分类概述 145 A.2 矩阵的解析 147 A.2.1 从向量到子空间 148 A.2.2 奇异值分解(SVD) 150 A.2.3 数据矩阵的四个基本子空间 151 A.3 线性系统求解 153 A.4 参考文献 155 作者简介 156 封面简介 156
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网