您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
推荐系统开发实战
字数: 582千字
装帧: 平装
出版社: 电子工业出版社
作者: 高阳团
出版日期: 2019-07-01
商品条码: 9787121365201
版次: 1
开本: 16开
页数: 345
出版年份: 2019
印次: 1
定价:
¥79
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
"我看程序员都是在实践中学习,是先有一个什么需求,现用现学。 ——万维纲 你为什么要买一本推荐系统的书,你一定就是想最终开发出真正的推荐系统。 你并不是想学习各种原理、算法,这些都是手段而不是目的。 本书可以满足你。 本书最终就是带你开发出三个真正的推荐系统——新闻推荐系统、音乐推荐系统、图书推荐系统。 真正的推荐系统是高度复杂的,可能用到多种算法、多种语言。 但,这不是我们学习的很优路径,也不是把一堆知识乱如团给你的理由。 真正好书应该是可以抽丝剥茧、化繁为简、找到合理颗粒度的能力。 本书努力去做了。 本书假定,你只懂Python,就可以了。 然后,缺什么我们给你补什么。 只给你紧急而必需的(因为我们相信我们是给你推开一扇门,后面的留给后面) 我们认为:具体的,总比抽象的更好理解 我们认为:动手做出的,总是听说的要真实 我们认为:人的认知就应该是从具体到抽象,再从抽象到具体。从抽象到抽象都是不负责的。 我们认为:读者是有感悟力的,只是缺少行动的抓手。 所以,我们给你一个又一个实例。 只有实践才是真知的来源。 只有实践才能给你走下去的勇气。 只有实践才能到达成功的彼岸。 小的知识点,有小的实例。 当你可以把这一个个小实例都能做出来了,就可以顺利地进入下一步——构建再大的项目了(这也是刻意练习的思想) 终结的有三个大实例——开发新闻推荐系统、开发音乐推荐系统、开发图书推荐系统。 我们希望本书可以带给你“解剖小麻雀,而知所有鸟类的基本结构”的体验。 希望您可以认真阅读本书的目录,给你一个不一样的学习体验。 行动吧,少年! "
内容简介
本书是一本关于推荐系统从入门到进阶的读物,采用“理论+实践”的形式展开,不仅对各种推荐算法进行了介绍,还对算法所涉及的基础理论知识进行了补充。
全书共分为3篇:
第1篇是“推荐系统的背景介绍和入门”,包括走进推荐系统、搭建你的一个推荐系统和推荐系统常用数据集介绍;
第2篇是“推荐系统涉及的算法介绍、冷启动和效果评估”,包括数据挖掘——让推荐系统更懂你、基于用户行为特征的推荐、基于标签的推荐、基于上下文的推荐、基于点击率预估的推荐、推荐系统中的冷启动和推荐系统中的效果评估;
第3篇是“推荐系统实例”,包括搭建一个新闻推荐系统、搭建一个音乐推荐系统、搭建一个图书推荐系统和业界推荐系统架构介绍。
书中的实例开发几乎都是基于公开的数据集进行的,当然也涉及一些网络中获取的数据,其最终目的都是让读者能够更好地理解推荐算法,更直观地认识推荐系统。
书中所涉及的数据集和实例代码都会提供给读者,这不仅在一定程度上方便读者学习,而且为以后的工作提供了便利。
本书非常适合有一定编程基础、对推荐系统感兴趣的读者,希望用推荐算法完成设计的高等院校计算机或电子信息专业的学生,准备开设推荐系统实践课的授课老师,学习过Python、希望进一步提升编程水平的开发者,初学数据挖掘、机器学习的算法工程师或数据分析师阅读使用。
作者简介
高阳团,原京东推荐算法工程师。所有渠道专享ID:Thinkgamer,CSDN博客专家,博客地址为https://blog.csdn.net/ gamer_gyt。一直从事推荐系统相关的研究和开发工作,擅长推荐排序、Spark、深度学习。
目录
第1篇 推荐系统的背景介绍和入门
第1章 走进推荐系统 2
1.1 从“啤酒与尿布”到推荐系统的前世今生 2
1.1.1 “啤酒与尿布” 2
1.1.2 推荐系统的前世今生 2
1.2 推荐系统可以做什么 4
1.2.1 什么是推荐系统 4
1.2.2 在电商类产品中的应用 5
1.2.3 在社交类产品中的应用 6
1.2.4 在音乐类产品中的应用 8
1.2.5 在视频类产品中的应用 9
1.2.6 在阅读类产品中的应用 10
1.2.7 在服务类产品中的应用 11
1.3 学习本书需要的技能 12
1.3.1 Python基础 12
1.3.2 数据结构 14
1.3.3 工程能力 15
1.4 如何学习本书 17
1.5 知识导图 17
第2章 搭建你的第一个推荐系统 19
2.1 实例1:搭建电影推荐系统 19
2.1.1 利用Netflix数据集准备数据 19
2.1.2 使用Python表示数据 21
2.1.3 选择相似用户 23
2.1.4 为用户推荐相似用户喜欢的电影 24
2.1.5 分析效果 25
2.2 总结:搭建推荐系统的一般步骤 26
2.2.1 准备数据 26
2.2.2 选择算法 27
2.2.3 模型训练 28
2.2.4 效果评估 28
2.3 知识导图 28
第3章 推荐系统常用数据集介绍 29
3.1 MovieLens数据集 29
3.1.1 README 29
3.1.2 ratings.dat 29
3.1.3 movies.dat 31
3.1.4 users.dat 34
3.2 Book-Crossings数据集 36
3.2.1 BX-Book-Ratings.csv 37
3.2.2 BX-Books.csv 39
3.2.3 BX-Users.csv 39
3.3 Last.fm数据集 41
3.3.1 README 41
3.3.2 artists.dat 41
3.3.3 tags.dat 41
3.3.4 user_artists.dat 42
3.3.5 user_friends.dat 42
3.3.6 uses_taggedartists.dat 42
3.3.7 user_taggedartists-timestamps.dat 42
3.4 FourSquare数据集 43
3.4.1 users.dat 43
3.4.2 venues.dat 44
3.4.3 checkins.dat 44
3.4.4 socialgraph.dat 44
3.4.5 ratings.dat 45
3.5 Kaggle比赛之retailrocket 数据集 46
3.5.1 events.csv 47
3.5.2 category_tree.csv 49
3.5.3 item_properties.csv 49
3.6 场景分析 49
3.7 知识导图 50
第2篇 推荐系统涉及的算法介绍、冷启动和效果评估
第4章 数据挖掘――让推荐系统更懂你 52
4.1 数据预处理 52
4.1.1 数据标准化 52
4.1.2 实例2:实现数据的标准化 54
4.1.3 数据离散化 56
4.1.4 实例3:基于信息熵的数据离散化 58
4.1.5 数据抽样 61
4.1.6 数据降维 63
4.1.7 实例4:对鸢尾花数据集特征进行降维 66
4.1.8 数据清理 68
4.1.9 相似度计算 71
4.2 数据分类 74
4.2.1 K最近邻算法 74
4.2.2 实例5:利用KNN算法实现性别判定 75
4.2.3 决策树算法 77
4.2.4 实例6:构建是否举办活动的决策树 80
4.2.5 朴素贝叶斯算法 84
4.2.6 实例7:基于朴素贝叶斯算法进行异常账户检测 87
4.2.7 分类器的评估 90
4.2.8 实例8:scikit-learn中的分类效果评估 92
4.3 数据聚类 92
4.3.1 kMeans算法 92
4.3.2 实例9:基于kMeans算法进行商品价格聚类 95
4.3.3 二分-kMeans算法 98
4.3.4 实例10:基于二分-kMeans算法进行商品价格聚类 99
4.3.5 聚类算法的评估 100
4.3.6 实例11:scikit-learn中的聚类效果评估 102
4.4 关联分析 103
4.4.1 Apriori算法 103
4.4.2 实例12:基于Apriori算法实现频繁项集和相关规则挖掘 106
4.5 知识导图 110
第5章 基于用户行为特征的推荐 111
5.1 用户行为分类 111
5.2 基于内容的推荐算法 112
5.2.1 算法原理――从“构造特征”到“判断用户是否喜欢” 112
5.2.2 实例13:对手机属性进行特征建模 115
5.3 实例14:编写一个基于内容推荐算法的电影推荐系统 117
5.3.1 了解实现思路 117
5.3.2 准备数据 119
5.3.3 选择算法 122
5.3.4 模型训练 122
5.3.5 效果评估 123
5.4 基于近邻的推荐算法 124
5.4.1 UserCF算法的原理――先“找到相似同户”,再“找到他们喜欢的物品” 124
5.4.2 ItemCF算法的原理――先“找到用户喜欢的物品”,再“找到喜欢物品的相似物品” 131
5.5 实例15:编写一个基于UserCF算法的电影推荐系统 137
5.5.1 了解实现思路 138
5.5.2 准备数据 138
5.5.3 选择算法 138
5.5.4 模型训练 138
5.5.5 效果评估 141
5.6 实例16:编写一个基于ItemCF算法的电影推荐系统 141
5.6.1 了解实现思路 141
5.6.2 准备数据 142
5.6.3 选择算法 142
5.6.4 模型训练 142
5.6.5 效果评估 144
5.7 对比分析:UserCF算法和ItemCF算法 145
5.8 对比分析:基于内容和基于近邻 146
5.9 基于隐语义模型的推荐算法 147
5.9.1 LFM概述 147
5.9.2 LFM算法理解 148
5.10 实例17:编写一个基于LFM的电影推荐系统 152
5.10.1 了解实现思路 152
5.10.2 准备数据 152
5.10.3 选择算法 154
5.10.4 模型训练 155
5.10.5 效果评估 158
5.11 知识导图 159
第6章 基于标签的推荐 161
6.1 基于标签系统的应用 161
6.1.1 Last.fm 161
6.1.2 Delicious 162
6.1.3 豆瓣 163
6.1.4 网易云音乐 163
6.2 数据标注与关键词提取 165
6.2.1 推荐系统中的数据标注 165
6.2.2 推荐系统中的关键词提取 167
6.2.3 标签的分类 168
6.3 实例18:基于TF-IDF算法提取商品标题的关键词 169
6.3.1 了解TF-IDF算法 169
6.3.2 认识商品标题描述 170
6.3.3 提取关键词 170
6.4 基于标签的推荐系统 174
6.4.1 标签评分算法 174
6.4.2 标签评分算法改进 176
6.4.3 标签基因 177
6.4.4 用户兴趣建模 177
6.5 实例19:利用标签推荐算法实现艺术家的推荐 178
6.5.1 了解实现思路 178
6.5.2 准备数据 178
6.5.3 选择算法 179
6.5.4 模型训练 179
6.5.5 效果评估 182
6.6 知识导图 182
第7章 基于上下文的推荐 184
7.1 基于时间特征的推荐 184
7.1.1 时间效应介绍 184
7.1.2 时间效应分析 187
7.1.3 推荐系统的实时性 194
7.1.4 协同过滤中的时间因子 195
7.2 实例20:实现一个“增加时间衰减函数的协同过滤算法” 197
7.2.1 在UserCF算法中增加时间衰减函数 197
7.2.2 在ItemCF算法中增加时间衰减函数 199
7.3 基于地域和热度特征的推荐 200
7.3.1 为什么要将地域和热度特征放在一起 201
7.3.2 解读LARS中的地域特征 202
7.3.3 基于地域和热度的推荐算法 204
7.4 实例21:创建一个基于地域和热度的酒店推荐系统 206
7.4.1 了解实现思路 206
7.4.2 准备数据 207
7.4.3 选择算法 207
7.4.4 模型训练 207
7.4.5 效果评估 210
7.5 其他上下文信息 210
7.6 知识导图 210
第8章 基于点击率预估的推荐 212
8.1 传统推荐算法的局限和应用 212
8.1.1 传统推荐算法的局限 212
8.1.2 传统推荐算法的应用 213
8.2 点击率预估在推荐系统中的应用 214
8.3 集成学习 214
8.3.1 集成学习概述 215
8.3.2 Boosting算法(提升法) 215
8.3.3 Bagging算法(自助法) 216
8.3.4 Stacking算法(融合法) 217
8.4 导数、偏导数、方向导数、梯度 217
8.4.1 导数 217
8.4.2 偏导数 217
8.4.3 方向导数 218
8.4.4 梯度 219
8.4.5 梯度下降 219
8.5 GBDT算法 222
8.5.1 Gradient Boosting方法 223
8.5.2 决策树 223
8.5.3 GBDT算法的原理 224
8.6 实例22:基于GBDT算法预估电信客户流失 227
8.6.1 了解实现思路 227
8.6.2 准备数据 229
8.6.3 选择算法 232
8.6.4 模型训练 232
8.6.5 效果评估 234
8.7 回归分析 236
8.7.1 什么是回归分析 236
8.7.2 回归分析算法分类 236
8.8 Logistic Regression算法 237
8.8.1 Sigmoid函数 237
8.8.2 LR为什么要使用Sigmoid函数 239
8.8.3 LR的算法原理分析 240
8.9 实例23:基于LR算法预估电信客户流失 241
8.9.1 准备数据 242
8.9.2 选择算法 242
8.9.3 模型训练 242
8.9.4 效果评估 243
8.10 GBDT+LR的模型融合 245
8.10.1 GBDT+LR模型融合概述 245
8.10.2 为什么选择GBDT和LR进行模型融合 246
8.10.3 GBDT+LR模型融合的原理 246
8.11 实例24:基于GBDT和LR算法预估电信客户流失 247
8.11.1 准备数据 247
8.11.2 选择算法 247
8.11.3 模型训练 247
8.11.4 效果评估 248
8.12 知识导图 251
第9章 推荐系统中的冷启动 252
9.1 冷启动介绍 252
9.1.1 冷启动的分类 252
9.1.2 冷启动的几种实现方法 252
9.2 基于热门数据推荐实现冷启动 253
9.3 利用用户注册信息实现冷启动 254
9.3.1 注册信息分析 254
9.3.2 实例25:分析Book-Crossings数据集中的共性特征 255
9.3.3 实现原理 261
9.4 利用用户上下文信息实现冷启动 261
9.4.1 设备信息特征 262
9.4.2 时间地域信息特征 262
9.4.3 实现原理 262
9.5 利用第三方数据实现冷启动 263
9.6 利用用户和系统之间的交互实现冷启动 263
9.6.1 实现原理 263
9.6.2 推荐系统中实时交互的应用 265
9.6.3 实例26:用户实时交互推荐系统设计 266
9.7 利用物品的内容属性实现冷启动 267
9.7.1 物品内容属性分析 267
9.7.2 物品信息的使用 268
9.8 利用专家标注数据实现冷启动 269
9.9 知识导图 270
第10章 推荐系统中的效果评估 271
10.1 用户调研 271
10.2 在线评估 272
10.3 在线实验方式――ABTest 272
10.3.1 ABTest介绍 272
10.3.2 ABTest流程 272
10.3.3 ABTest的注意事项 273
10.4 在线评估指标 274
10.4.1 点击率 275
10.4.2 转化率 275
10.4.3 网站成交额 275
10.5 离线评估 276
10.6 拆分数据集 276
10.6.1 留出法 277
10.6.2 K-折交叉验证法 277
10.6.3 自助法 277
10.6.4 实例27:使用sklearn包中的train_test_split()函数进行数据集拆分 278
10.6.5 实例28:使用sklearn包中的KFold()函数产生交叉验证数据集 280
10.6.6 实例29:使用sklearn包中的cross_validate()函数演示交叉验证 281
10.7 离线评估指标 282
10.7.1 准确度指标之预测分类准确度指标 282
10.7.2 实例30:使用sklearn包中的metrics类预测分类准确度 288
10.7.3 准确度指标之预测评分准确度指标 290
10.7.4 实例31:使用sklearn包中的metrics类预测评分准确度 290
10.7.5 准确度指标之预测评分关联指标 291
10.7.6 准确度指标之排序准确度指标 292
10.7.7 非准确度指标 292
10.8 知识导图 296
第3篇 推荐系统实例
第11章 实例32:搭建一个新闻推荐系统 298
11.1 准备数据 298
11.2 预处理数据 298
11.2.1 原始数据加工 298
11.2.2 新闻热度值计算 299
11.2.3 新闻相似度计算 300
11.2.4 指定标签下的新闻统计 302
11.3 设计架构 303
11.4 实现系统 304
11.4.1 准备环境 304
11.4.2 实现后端接口 304
11.4.3 实现前端界面 309
11.4.4 系统演示 309
11.5 代码复现 311
11.5.1 安装依赖 311
11.5.2 数据入库 312
11.5.3 修改配置 312
11.5.4 项目启动 312
11.6 知识导图 312
第12章 实例33:搭建一个音乐推荐系统 314
12.1 准备数据 314
12.2 预处理数据 314
12.2.1 计算歌曲、歌手、用户相似度 314
12.2.2 计算用户推荐集 315
12.2.3 数据导入数据库 319
12.3 设计架构 321
12.4 实现系统 322
12.4.1 准备环境 322
12.4.2 实现后端接口 322
12.4.3 实现前端界面 324
12.4.4 系统演示 324
12.5 代码复现 327
12.5.1 安装依赖 327
12.5.2 数据入库 327
12.5.3 修改配置 327
12.5.4 项目启动 328
12.6 知识导图 328
第13章 实例34:搭建一个图书推荐系统 329
13.1 准备数据 329
13.2 预处理数据 329
13.2.1 原始数据加工 329
13.2.2 数据导入数据库 331
13.2.3 模型准备 331
13.3 设计架构 332
13.4 实现系统 333
13.4.1 准备环境 333
13.4.2 实现后端接口 333
13.4.3 实现前端界面 336
13.4.4 系统演示 336
13.5 代码复现 338
13.6 知识导图 338
第14章 业界推荐系统架构介绍 340
14.1 概述 340
14.2 架构介绍 340
14.3 召回内容 342
14.4 计算排序 343
14.4.1 特征工程 343
14.4.2 特征分类 343
14.4.3 排序算法 343
14.5 物品过滤和展示 344
14.5.1 物品过滤 344
14.5.2 物品展示 344
14.6 效果评估 344
14.7 知识导图 345
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网