您好,欢迎来到聚文网。 登录 免费注册
实用推荐系统

实用推荐系统

  • 字数: 487000
  • 装帧: 平装
  • 出版社: 电子工业出版社
  • 作者: (丹)金·福尔克
  • 出版日期: 2021-10-01
  • 商品条码: 9787121420788
  • 版次: 1
  • 开本: 16开
  • 页数: 436
  • 出版年份: 2021
定价:¥119 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
"介绍推荐系统原理和关键算法,配备大量代码,适合入门 对于书中所涉及的数学和统计学知识,均提供示例图和代码,直观易懂 涵盖从数据收集到生成推荐的全过程,提供详细的Python代码及注释,代码可在GitHub上下载 剖析流行的算法在Amazon和Netflix上的应用"
内容简介
要构建一个实用的“智能”推荐系统,不仅需要有好的算法,还需要了解接收推荐的用户。本书分为两部分,第一部分侧重于基础架构,主要介绍推荐系统的工作原理,展示如何创建推荐系统,以及给应用程序增加推荐系统时,应该如何收集和应用数据;第二部分侧重于算法,介绍推荐系统算法,以及如何使用系统收集的数据来计算向用户推荐什么内容。作者还教授了如何使用最流行的推荐算法,并剖析它们在Amazon和Netflix等网站上的实际应用。本书适合对推荐系统感兴趣的开发人员阅读,从事数据科学行业的读者也能从书中获得启发。
作者简介
"Kim Falk 是一位数据科学家,他在构建数据驱动的应用程序方面有着丰富的经验。他对推荐系统和机器学习很感兴趣。他所训练的推荐系统,为用户推荐合适的电影,为人们推送广告,甚至帮助律师找到判例法的内容。自2010 年以来,他一直从事大数据解决方案和机器学习方面的工作。Kim 经常参与有关推荐系统的演讲和写作。 当Kim 不工作的时候,他就是一个居家男人,是一位父亲,会带着他的德国短毛指示犬进行越野跑。"
目录
第1部分推荐系统的准备工作
第1章什么是推荐.3
1.1现实生活中的推荐.3
1.1.1推荐系统在互联网上大显身手.5
1.1.2长尾.5
1.1.3Netflix的推荐系统.6
1.1.4推荐系统的定义.13
1.2推荐系统的分类.15
1.2.1域.16
1.2.2目的.16
1.2.3上下文.17
1.2.4个性化级别.17
1.2.5专家意见.19
1.2.6隐私与可信度.19
1.2.7接口.20
1.2.8算法.23
1.3机器学习与NetflixPrize.24
1.4MovieGEEKs网站.25
1.4.1设计与规范.27
1.4.2架构.27
1.5构建一个推荐系统.29
小结.31
第2章用户行为以及如何收集用户行为数据.32
2.1在浏览网站时Netflix如何收集证据.33
2.1.1Netflix收集的证据.35
2.2寻找有用的用户行为.37
2.2.1捕获访客印象.38
2.2.2可以从浏览者身上学到什么.38
2.2.3购买行为.43
2.2.4消费商品.44
2.2.5访客评分.45
2.2.6以(旧的)Netflix方式了解你的用户.48
2.3识别用户.49
2.4从其他途径获取访客数据.50
2.5收集器.50
2.5.1构建项目文件.52
2.5.2数据模型.52
2.5.3告密者(snitch):客户端证据收集器.53
2.5.4将收集器集成到MovieGEEKs中.54
2.6系统中的用户是谁以及如何对其进行建模.57
小结.60
第3章监控系统.61
3.1为什么添加仪表盘是个好主意.62
3.1.1回答“我们做得怎么样?”.62
3.2执行分析.64
3.2.1网站分析.64
3.2.2基本统计数据.64
3.2.3转化.65
3.2.4分析转化路径.69
3.2.5转化路径.70
3.3角色.73
3.4MovieGEEKs仪表盘.76
3.4.1自动生成日志数据.76
3.4.2分析仪表盘的规范和设计.77
3.4.3分析仪表盘示意图.77
3.4.4架构.78
小结.81
第4章评分及其计算方法.82
4.1用户-商品喜好.83
4.1.1什么是评分.83
4.1.2用户-商品矩阵.84
4.2显式评分和隐式评分.86
4.2.1如何选择可靠的推荐来源.87
4.3重温显式评分.88
4.4什么是隐式评分.88
4.4.1与人相关的推荐.90
4.4.2关于计算评分的思考.90
4.5计算隐式评分.93
4.5.1看看行为数据.94
4.5.2一个有关机器学习的问题.98
4.6如何计算隐式评分.99
4.6.1添加时间因素.102
4.7低频商品更有价值.105
小结.107
第5章非个性化推荐.108
5.1什么是非个性化推荐.109
5.1.1什么是广告.109
5.1.2推荐有什么作用.110
5.2当没有数据的时候如何做推荐.111
5.2.1商品的十大排行榜.113
5.3榜单的实现以及推荐系统组件的准备工作.114
5.3.1推荐系统组件.114
5.3.2GitHub上的MovieGEEKs网站代码.116
5.3.3推荐系统.116
5.3.4为MovieGEEKs网站添加一个榜单.116
5.3.5使内容看起来更具吸引力.117
5.4种子推荐.119
5.4.1频繁购买的商品与你正在查看的商品很相似.120
5.4.2关联规则.121
5.4.3实现关联规则.126
5.4.4在数据库中存储关联规则.130
5.4.5计算关联规则.131
5.4.6运用不同的事件来创建关联规则.133
小结.133
第6章冷用户(冷商品).135
6.1什么是冷启动.135
6.1.1冷商品.137
6.1.2冷用户.137
6.1.3灰羊.139
6.1.4现实生活中的例子.139
6.1.5面对冷启动你能做什么.140
6.2追踪访客.141
6.2.1执着于匿名用户.141
6.3用算法来解决冷启动问题.141
6.3.1使用关联规则为冷用户创建推荐信息.142
6.3.2使用领域知识和业务规则.143
6.3.3使用分组.144
6.3.4使用类别来避免灰羊问题以及如何介绍冷商品.146
6.4那些不询问就很难被发现的人.147
6.4.1当访客数据不够新时.148
6.5使用关联规则快速进行推荐.148
6.5.1收集数据项.149
6.5.2检索关联规则并根据置信度对其排序.150
6.5.3显示推荐内容.151
6.5.4评估.154
小结.154
第2部分推荐算法
第7章找出用户之间和商品之间的相似之处.157
7.1什么是相似度.158
7.1.1什么是相似度函数.159
7.2基本的相似度函数.160
7.2.1Jaccard距离.161
7.2.2使用Lp-norm测量距离.162
7.2.3Cosine相似度.165
7.2.4通过Pearson相关系数查找相似度.167
7.2.5运行Pearson相似度.169
7.2.6Pearson相关性系数与Cosine相似度类似.171
7.3k-means聚类.171
7.3.1k-means聚类算法.172
7.3.2使用Python实现k-means聚类算法.174
7.4实现相似度.178
7.4.1在MovieGEEKs网站上实现相似度.181
7.4.2在MovieGEEKs网站上实现聚类.183
小结.187
第8章邻域协同过滤.188
8.1协同过滤:一节历史课.190
8.1.1当信息被协同过滤时.190
8.1.2互帮互助.190
8.1.3评分矩阵.192
8.1.4协同过滤管道.193
8.1.5应该使用用户-用户还是物品-物品的协同过滤.194
8.1.6数据要求.195
8.2推荐的计算.195
8.3相似度的计算.196
8.4Amazon预测物品相似度的算法.196
8.5选择邻域的方法.201
8.6找到正确的邻域.203
8.7计算预测评分的方法.204
8.8使用基于物品的过滤进行预测.206
8.8.1计算物品的预测评分.206
8.9冷启动问题.207
8.10机器学习术语简介.208
8.11MovieGeeks网站上的协同过滤.209
8.11.1基于物品的过滤.209
8.12关联规则推荐和协同推荐之间有什么区别.215
8.13用于协同过滤的工具.215
8.14协同过滤的优缺点.217
小结.218
第9章评估推荐系统.219
9.1推荐系统的评估周期.220
9.2为什么评估很重要.221
9.3如何解释用户行为.222
9.4测量什么.223
9.4.1了解我的喜好,尽量减少预测错误.223
9.4.2多样性.224
9.4.3覆盖率.225
9.4.4惊喜度.227
9.5在实现推荐之前.228
9.5.1验证算法.228
9.5.2回归测试.229
9.6评估的类型.230
9.7离线评估.231
9.7.1当算法不产生任何推荐时该怎么办.231
9.8离线实验.232
9.8.1准备实验数据.237
9.9在MovieGEEKs中实现这个实验.244
9.9.1待办任务清单.244
9.10评估测试集.248
9.10.1从基线预测器开始.248
9.10.2找到正确的参数.251
9.11在线评估.252
9.11.1对照实验.252
9.11.2A/B测试.253
9.12利用exploit/explore持续测试.254
9.12.1反馈循环.255
小结.256
第10章基于内容的过滤.257
10.1举例说明.258
10.2什么是基于内容的过滤.261
10.3内容分析器.262
10.3.1从物品配置文件提取特征.262
10.3.2数量较少的分类数据.265
10.3.3将年份转换为可比较的特征.265
10.4从描述中提取元数据.266
10.4.1准备描述.266
10.5使用TF-IDF查找重要单词.270
10.6使用LDA进行主题建模.272
10.6.1有什么方法可以调整LDA.279
10.7查找相似内容.282
10.8如何创建用户配置文件.283
10.8.1使用LDA创建用户配置文件.283
10.8.2使用TF-IDF创建用户配置文件.283
10.9MovieGEEKs中基于内容的推荐.286
10.9.1加载数据.286
10.9.2训练模型.287
10.9.3创建物品配置文件.288
10.9.4创建用户配置文件.289
10.9.5展示推荐.291
10.10评估基于内容的推荐系统.292
10.11基于内容过滤的优缺点.293
小结.294
第11章用矩阵分解法寻找隐藏特征.295
11.1有时减少数据量是好事.296
11.2你想要解决的问题的例子.298
11.3谈一点线性代数.301
11.3.1矩阵.301
11.3.2什么是因子分解.303
11.4使用SVD构造因子分解.304
11.4.1通过分组加入添加新用户.310
11.4.2如何使用SVD进行推荐.313
11.4.3基线预测.313
11.4.4时间动态.316
11.5使用FunkSVD构造因子分解.317
11.5.1均方根误差.317
11.5.2梯度下降.318
11.5.3随机梯度下降.321
11.5.4最后是因子分解.322
11.5.5增加偏差.323
11.5.6如何开始,何时结束.324
11.6用FunkSVD进行推荐.328
11.7MovieGEEKs中的FunkSVD实现.331
11.7.1如何处理异常值.335
11.7.2保持模型的更新.336
11.7.3更快的实施方法.337
11.8显式数据与隐式数据.337
11.9评估.337
11.10用于FunkSVD的参数.339
小结.341
第12章运用很好算法来实现混合推荐.342
12.1混合推荐系统的困惑世界.343
12.2单体.344
12.2.1将基于内容的特征与行为数据混合,以改进协同过滤推荐系统.345
12.3掺杂式混合推荐.346
12.4集成推荐.347
12.4.1可切换的集成推荐.348
12.4.2加权式集成推荐.349
12.4.3线性回归.350
12.5特征加权线性叠加(FWLS).351
12.5.1元特征:权重作为函数.352
12.5.2算法.353
12.6实现.360
小结.370
第13章排序和排序学习.371
13.1Foursquare的排序学习例子.372
13.2重新排序.376
13.3什么是排序学习.377
13.3.1三种类型的LTR算法.377
13.4贝叶斯个性化排序.379
13.4.1BPR排序.381
13.4.2数学魔术(高级巫术).383
13.4.3BPR算法.386
13.4.4具有矩阵分解的BPR.387
13.5BPR的实现.388
13.5.1执行推荐.393
13.6评估.394
13.7用于BPR的参数.397
小结.398
第14章推荐系统的未来.399
14.1本书内容总结.400
14.2接下来要学习的主题.403
14.2.1延伸阅读.403
14.2.2算法.404
14.2.3所处环境.404
14.2.4人机交互.405
14.2.5选择一个好的架构.405
14.3推荐系统的未来是什么.406
14.4最后的想法.411

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网