您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
PYTHON数据分析与数据化运营(第2版)
装帧: 平装
出版社: 机械工业出版社
作者: 宋天龙
出版日期: 2019-06-01
商品条码: 9787111627760
版次: 2
开本: 16开
页数: 549
出版年份: 2019
定价:
¥129
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
(1)作者是有10余年数据分析与数据化运营经验的大数据专家,在国内外企业都工作过,经验丰富。(2)作者善于总结和写作,乐于分享,撰写数据分析类 畅销书3部。(3)本书与同类书*大的不同在于,并不只有纯粹的关于数据分析技术和工具的讲解,而且还与数据使用场景深度结合,在业务上真正可指导落地。(4)新版除了Python更新到了*新版外,具体内容上做了大幅度的补充和优化,整体篇幅超过30%,详见前言。(5)本书作者提供微信、邮箱等,可通过实时和离线两种方式及时为读者在线传道、受业、解惑。
内容简介
这是一本将数据分析技术与数据使用场景深度结合的著作,从实战角度讲解了如何利用Python进行数据分析和数据化运营。畅销书全新、大幅升级,第1版近乎100%的好评,第2版不仅将Python升级到了*新的版本,而且对具体内容进行了大幅度的补充和优化。作者是有10余年数据分析与数据化运营的大数据专家,书中对50余个数据工作流知识点、14个数据分析与挖掘主题、4个数据化运营主题、8个综合性案例进行了全面的讲解,能让数据化运营结合数据使用场景360°落地。全书一共9章,分为两个部分:第壹部分(第1-4章) Python数据分析与挖掘首先介绍了Python和数据化运营的基本知识,然后详细讲解了Python数据获取(结构化和非结构化)、预处理、分析和挖掘的关键技术和经验,包含10大类预处理经验、14个数据分析与挖掘主题,50余个知识点。第二部分(第5~9章) Python数据化运营这是本书的核心,详细讲解了会员运营、商品运营、流量运营和内容运营4大主题,以及提升数据化运营价值的方法。每个运营主题中都包含了基本知识、评估指标、应用场景、数据分析模型、数据分析小技巧、数据分析大实话以及2个综合性的应用案例。------添加作者微信(TonySong2013)可在线获取实时解答,同时加入本书沟通群(作者拉入群),交流更多数据工作的感悟和心得并认识更多同行从业者;本书提供案例数据和源代码(中文注释)下载,供读者实操时使用。
作者简介
作者简介宋天龙(TonySong)大数据技术专家,触脉咨询合伙人兼副总裁,前Webtrekk中国区技术和咨询负责人(Webtrekk,德国*大的在线数据分析服务提供商)。擅长数据挖掘、建模、分析与运营,精通端到端数据价值场景设计、业务需求转换、数据结构梳理、数据建模与学习以及数据工程交付。在电子商务、零售、银行、保险等多个行业拥有丰富的数据项目工作经验,参与过集团和企业级数据体系规划、DMP与数据仓库建设、大数据产品开发、网站流量系统建设、个性化智能推荐与精准营销、企业大数据智能等。参与实施客户案例包括联合利华、Webpower、德国OTTO集团电子商务(中国)、Esprit中国、猪八戒网、顺丰优选、乐视商城、泰康人寿、酒仙网、国美在线、迪信通等。著有多部畅销书:《Python数据分析与数据化运营》《网站数据挖掘与分析:系统方法与商业实践》《企业大数据系统构建实战:技术、架构、实施与应用》
目录
前言第1章 Python和数据化运营11.1 用Python做数据化运营11.1.1 Python是什么11.1.2 数据化运营是什么21.1.3 Python用于数据化运营51.2 数据化运营所需的Python相关工具和组件51.2.1 Python程序61.2.2 Python交互环境Jupyter71.2.3 Python第三方库231.2.4 数据库和客户端291.2.5 SSH远程客户端301.3 内容延伸:Python的OCR和tensorflow311.3.1 OCR工具:Tesseract-ocr311.3.2 机器学习框架:TensorFlow311.4 第1个用Python实现的数据化运营分析实例、销售预测321.4.1 案例概述321.4.2 案例过程321.4.3 案例小结361.5 本章小结37第2章 数据化运营的数据来源402.1 数据化运营的数据来源类型402.1.1 数据文件402.1.2 数据库412.1.3 API422.1.4 流式数据432.1.5 外部公开数据432.1.6 其他来源442.2 使用Python获取运营数据442.2.1 从文本文件读取运营数据442.2.2 从Excel获取运营数据552.2.3 从关系型数据库MySQL读取运营数据572.2.4 从非关系型数据库MongoDB读取运营数据642.2.5 从API获取运营数据682.3 内容延伸:读取非结构化网页、文本、图像、视频、语音722.3.1 从网页中获取运营数据722.3.2 读取非结构化文本数据732.3.3 读取图像数据742.3.4 读取视频数据782.3.5 读取语音数据812.4 本章小结85第3章 10条数据化运营不得不知道的数据预处理经验873.1 数据清洗:缺失值、异常值和重复值的处理873.1.1 数据列缺失的4种处理方法873.1.2 不要轻易抛弃异常数据893.1.3 数据重复就需要去重吗903.1.4 代码实操:Python数据清洗923.2 将分类数据和顺序数据转换为标志变量1003.2.1 分类数据和顺序数据是什么1003.2.2 运用标志方法处理分类和顺序变量1013.2.3 代码实操:Python标志转换1013.3 大数据时代的数据降维1043.3.1 需要数据降维的情况1043.3.2 基于特征选择的降维1053.3.3 基于特征转换的降维1063.3.4 基于特征组合的降维1123.3.5 代码实操:Python数据降维1143.4 解决样本类别分布不均衡的问题1233.4.1 哪些运营场景中容易出现样本不均衡1243.4.2 通过过抽样和欠抽样解决样本不均衡1243.4.3 通过正负样本的惩罚权重解决样本不均衡1243.4.4 通过组合/集成方法解决样本不均衡1253.4.5 通过特征选择解决样本不均衡1253.4.6 代码实操:Python处理样本不均衡1253.5 数据化运营要抽样还是全量数据1283.5.1 什么时候需要抽样1283.5.2 如何进行抽样1293.5.3 抽样需要注意的几个问题1303.5.4 代码实操:Python数据抽样1313.6 解决运营数据的共线性问题1353.6.1 如何检验共线性1353.6.2 解决共线性的5种常用方法1363.6.3 代码实操:Python处理共线性问题1373.7 有关相关性分析的混沌1393.7.1 相关和因果是一回事吗1393.7.2 相关系数低就是不相关吗1393.7.3 代码实操:Python相关性分析1403.8 标准化,让运营数据落入相同的范围1413.8.1 实现中心化和正态分布的Z-Score1413.8.2 实现归一化的Max-Min1423.8.3 用于稀疏数据的MaxAbs1423.8.4 针对离群点的RobustScaler1423.8.5 代码实操:Python数据标准化处理1423.9 离散化,对运营数据做逻辑分层1453.9.1 针对时间数据的离散化1453.9.2 针对多值离散数据的离散化1463.9.3 针对连续数据的离散化1463.9.4 针对连续数据的二值化1473.9.5 代码实操:Python数据离散化处理1473.10 内容延伸:非结构化数据的预处理1513.10.1 网页数据解析1513.10.2 网络用户日志解析1593.10.3 图像的基本预处理1643.10.4 自然语言文本预处理1693.11 本章小结172第4章 跳过运营数据分析和挖掘的“大坑”1744.1 聚类分析1744.1.1 当心数据异常对聚类结果的影响1754.1.2 超大数据量时应该放弃K均值算法1754.1.3 聚类不仅是建模的终点,更是重要的中间预处理过程1774.1.4 高维数据上无法应用聚类吗1784.1.5 如何选择聚类分析算法1794.1.6 案例:客户特征的聚类与探索性分析1794.2 回归分析1964.2.1 注意回归自变量之间的共线性问题1974.2.2 相关系数、判定系数和回归系数之间是什么关系1974.2.3 判定系数是否意味着相应的因果联系1974.2.4 注意应用回归模型时研究自变量是否产生变化1984.2.5 如何选择回归分析算法1984.2.6 案例:大型促销活动前的销售预测1994.3 分类分析2064.3.1 防止分类模型的过拟合问题2074.3.2 使用关联算法做分类分析2074.3.3 用分类分析来提炼规则、提取变量、处理缺失值2084.3.4 类别划分:分类算法和聚类算法都是好手2094.3.5 如何选择分类分析算法2104.3.6 案例:用户流失预测分析与应用2104.4 关联分析2214.4.1 频繁规则不一定是有效规则2214.4.2 不要被啤酒尿布的故事禁锢你的思维2224.4.3 被忽略的“负相关”模式真的毫无用武之地吗2234.4.4 频繁规则只能打包组合应用吗2
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网