您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
Python预测分析与机器学习/清华开发者书库
字数: 510
出版社: 清华大学
作者: 编者:王沁晨|责编:赵佳霓
商品条码: 9787302592549
版次: 1
开本: 16开
页数: 324
出版年份: 2022
印次: 1
定价:
¥89
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥22.05
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书从理解问题定义、 了解数据内的高层信息、数 据清理、可视化数据,到基 础建模、模型优化,分享一 个数据分析师的视角与思路 。在预测分析的流程中,一 步步用详细的图文和代码讲 解使用到的库,如何正确使 用各个库中的方法和函数, 以及在遇到类似的问题时如 何套用学过的知识。 本书共8章。第1章对预 测分析的流程进行一个高层 次的概述。第2章介绍本书 需要使用的库,并讲解数据 清理步骤的执行。第3章讲 解基础建模需考虑的细节, 结合第4章的模型选择,可 以搭建一个基础的预测管道 。第5章和第6章分别从模型 和数据的角度讲解如何优化 预测表现。第7章讲解时间 序列这一特殊数据的预测方 法。第8章总结全书的内容 ,解决一个实战问题。 本书面向3类读者。第1 类为有编程基础但毫无数据 科学背景,有意入门的读者 ;第2类为有数据科学理论 基础,有意进入实操的读者 ;第3类为有数据科学理论 基础与实操经验,但日常工 作集中在数据分析管道中的 数据分析师。
作者简介
王沁晨,多伦多大学圣乔治校区计算机专业,曾在加拿大零售企业Loblaw Companies担任机器学习数据分析师,从公司传统的大型数据库中筛选有效信息、清理数据、人工数据挖掘、视化,到基础建模、模型优化、数据再筛选,再到结合商业需求创造扩展性强的实用管线,让项目从理论性的头脑风暴变现为商业价值。
目录
第1章 预测分析与机器学习的实用价值 1.1 人工智能、机器学习与数据分析的关系 1.2 什么是预测分析 1.3 预测分析在各行业中的应用 1.4 预测分析流程概览 1.5 小结 第2章 数据清理 2.1 建立编程环境 2.1.1 Anaconda简介及安装 2.1.2 Jupyter Notebook简介及安装 2.1.3 Pandas简介及安装 2.1.4 scikit-learn简介及安装 2.1.5 XGBoost、LightGBM、CatBoost简介及安装 2.1.6 TensorFlow简介及安装 2.2 面对异构数据如何下手 2.2.1 什么是异构数据 2.2.2 如何处理异构数据 2.3 数据误差 2.3.1 各类数据误差及其影响 2.3.2 如何处理数据误差 2.4 数据重新格式化 第3章 基础建模 3.1 判断何为X和y 3.1.1 X和y的定义 3.1.2 X和y的选择对预测的影响 3.2 训练集、验证集与测试集 3.2.1 三者的定义及关系 3.2.2 如何使用sklearn分离3个集 3.2.3 如何使用Pandas手动分离3个集 3.3 数据泄露 3.3.1 不同类型的数据泄露 3.3.2 发现并避免目标泄露 3.3.3 避免训练集与测试集的相互污染 3.4 偏差与方差 3.4.1 定义偏差与方差 3.4.2 过拟合与欠拟合 3.4.3 实践中的过拟合与欠拟合 3.5 小结 第4章 模型选择 4.1 朴素贝叶斯分类器 4.2 关联规则算法 4.3 K近邻算法 4.4 K均值聚类算法 4.5 回归算法 4.5.1 线性回归 4.5.2 罗吉斯蒂回归 4.6 深度神经网络 4.7 决策树 4.8 森林算法 4.8.1 随机森林 4.8.2 极端随机树 4.8.3 孤立森林 4.9 提升方法 4.9.1 Adaboost 4.9.2 XGBoost和LightGBM 4.9.3 CatBoost 第5章 模型优化 5.1 损失函数和衡量指标 5.1.1 分类问题的衡量指标 5.1.2 回归问题的衡量指标 5.1.3 损失函数 5.2 K折交叉验证 5.3 超参数调试 5.3.1 网格搜索法 5.3.2 随机搜索法 5.3.3 遗传算法 5.4 函数正则化 第6章 数据优化 6.1 数据规范化 6.2 异常值清理 6.3 平滑法 6.4 聚类 6.5 特征工程 第7章 时间序列 7.1 时间序列简介 7.2 时间序列数据探索 7.2.1 加法模型下的可视化图 7.2.2 乘法模型下的部分可视化图 7.3 时间序列特征提取 7.3.1 时间特征 7.3.2 滞后特征 7.3.3 基于移动窗口的特征 7.3.4 基于展开窗口的特征 7.4 .时间序列模型 7.4.1 自回归模型 7.4.2 滑动平均模型 7.4.3 整合移动平均自回归模型 7.4.4 季节性整合移动平均自回归模型 第8章 实战 8.1 M5预测分析比赛介绍 8.1.1 数据介绍 8.1.2 评估标准 8.2 数据清理 8.3 基础建模 8.4 优化
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网