大数据分析师面试笔试宝典--聚文网

精选

¥5.83

世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版

¥5.39

正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册

¥8.58

简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版

¥5.83

世界文学名著全49册中小学生青少年课外书籍文学小说批发正版

¥4.95

全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷

¥8.69

父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册

¥24.2

好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册

¥7.15

幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书

¥11.55

用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书

¥19.8

少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版

¥64

科学真好玩

¥12.7

一年级下4册·读读童谣和儿歌

¥38.4

原生态新生代(传统木版年画的当代传承国际研讨会论文集)

¥11.14

法国经典中篇小说

¥11.32

上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)

¥21.56

猫的摇篮(精)

¥30.72

幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书

旧时风物(精)

三希堂三帖/墨林珍赏

寒山子庞居士诗帖/墨林珍赏

苕溪帖/墨林珍赏

楷书王维诗卷/墨林珍赏

兰亭序/墨林珍赏

祭侄文稿/墨林珍赏

蜀素帖/墨林珍赏

真草千字文/墨林珍赏

进宴仪轨(精)/中国古代舞乐域外图书

舞蹈音乐的基础理论与应用

内容简介

《大数据分析师面试笔试宝典》旨在帮助读者了解大数据分析师的工作内容、技能要求、各类常用技术的原理和可能应用的场景。大数据分析是一个多学科交叉的领域，包含了统计学、计算机科学、运筹学乃至市场营销学等。《大数据分析师面试笔试宝典》并没有介绍大数据分析领域涉及的所有方面，而是根据当前用人单位对大数据分析师的需求，选择了其中较为重要的内容进行解析，将当前大数据分析涉及的热点技术一网打尽。阅读《大数据分析师面试笔试宝典》需要具备一定的数理统计知识基础和计算机编程背景。本书尽量不去证明一些在理论界已有的结论，而是用浅显的语言来解释复杂的公式，以便读者更为轻松地掌握全书的知识，从而能够从容面对面试以及日常工作。

作者简介

周炎亮，全栈数据分析师，北京化工大学工程管理硕士。拥有10多年的数据分析经验，擅长将各种业务问题转化为可量化的数学模型。先后在咨询公司、互联网公司担任数据分析师，现在某工业互联网公司担任高级数据分析经理，致力于解决工业领域的数据分析问题。刘志全，博士，暨南大学网络空间安全学院副研究员、硕士生导师；近年来共在IEEE TITS、IEEE TDSC、IEEE IOTJ、IEEE TVT等国内外权威期刊/会议发表SCI/EI论文40余篇，申请/授权/公告国家发明专利/国外发明专利/PCT专利40余项。

第1章面试经验／1 1.1 大数据分析技能要求／1 1.1.1 数据分析师／1 1.1.2 数据开发工程师／4 1.1.3 数据挖掘工程师／7 1.1.4 职业能力模型／10 1.2 数据分析工作流程／10 1.2.1 组织架构／10 1.2.2 分析流程／11 1.3 数据分析师临场面试／13 1.3.1 如何准备面试／13 1.3.2 面试问题／16 1.4 本章总结／18 第2章统计学知识／19 2.1 概率知识／19 2.1.1 概率模型之间的关系解析／19 2.1.2 概率相关面试题／25 2.1.3 贝叶斯公式／28 2.2 参数估计／31 2.2.1 点估计／31 2.2.2 区间估计／34 2.3 假设检验／41 2.3.1 假设检验原理／41 2.3.2 两类错误／43 2.3.3 假设检验的常用方法／45 2.4 抽样技术解析／49 2.4.1 样本量影响因素分析／50 2.4.2 假设检验样本量计算／52 2.4.3 参数估计样本量计算／53 2.5 马尔可夫模型／54 2.5.1 马尔可夫过程原理／55 2.5.2 马尔可夫模型计算／55 2.6 隐马尔可夫模型／57 2.6.1 HMM和三类问题／57 2.6.2 求概率问题／58 2.6.3 预测问题／59 2.6.4 学习问题／60 2.7 EM算法／62 2.7.1 基本思想／62 2.7.2 算法流程／63 2.8 本章总结／63 第3章数据挖掘算法／65 3.1 常用聚类算法／66 3.1.1 Kmeans算法／66 3.1.2 DBSCAN算法／68 3.1.3 聚类算法评估／69 3.2 常用分类算法／74 3.2.1 决策树／74 3.2.2 朴素贝叶斯／79 3.2.3 KNN／80 3.2.4 SVM／81 3.2.5 逻辑回归／84 3.2.6 BP神经网络／88 3.3 集成学习算法／91 3.3.1 Bagging原理／92 3.3.2 随机森林／93 3.3.3 Boosting原理／95 3.3.4 Adaboost算法／96 3.3.5 Stacking算法／99 3.3.6 分类算法评估／100 3.3.7 分类算法小结／108 3.4 关联规则算法／108 3.4.1 Apriori／108 3.4.2 Fp_Growth／111 3.4.3 算法评估／112 3.5 数据降维算法／112 3.5.1 降维技术基本理论／112 3.5.2 特征选择／113 3.5.3 主成分分析／116 3.5.4 SVD分解／118 3.5.5 降维方法选择／121 3.6 数据升维方法／121 3.6.1 分箱／121 3.6.2 交互式特征／123 3.7 推荐算法／124 3.7.1 基于内容推荐／124 3.7.2 基于用户的协同过滤／125 3.7.3 基于物品的协同过滤／126 3.7.4 SVD推荐原理／127 3.7.5 推荐算法评估／130 3.8 模型优化方法／130 3.8.1 机器学习抽样／130 3.8.2 相似性度量／134 3.8.3 损失函数／136 3.8.4 过拟合与欠拟合／138 3.8.5 正则化方法／139 3.8.6 剪枝方法／141 3.8.7 模型选择／144 3.9 本章总结／145 第4章大数据技术解析／147 4.1 数据埋点技术／148 4.1.1 技术原理／148 4.1.2 代码埋点／149 4.1.3 可视化埋点／149 4.1.4 无埋点技术／150 4.1.5 埋点需求分析／150 4.1.6 选择部署方式／151 4.2 网络爬虫技术／152 4.2.1 聚焦爬虫工作流程／153 4.2.2 数据解析流程／154 4.2.3 爬行策略／154 4.2.4 网页更新策略／155 4.3 数据仓库技术／156 4.3.1 数仓名词解析／156 4.3.2 数据建模方法／161 4.3.3 数仓建设原则／164 4.3.4 SQL查询／166 4.3.5 SQL查询优化／170 4.4 ETL技术／171 4.4.1 数据质量评估／172 4.4.2 ETL流程／173 4.4.3 缺失值处理方法／177 4.4.4 异常值识别方法／179 4.5 Hadoop技术／180 4.5.1 Hadoop核心之HDFS／181 4.5.2 Hadoop核心之MapReduce／184 4.5.3 YARN／190 4.5.4 WordCount源码／192 4.5.5 MapReduce优化／194 4.6 Spark技术／196 4.6.1 Spark集群运行／196 4.6.2 Spark程序运行／199 4.6.3 Spark RDD／202 4.6.4 Spark存储／210 4.6.5 Spark 内存管理／216 4.6.6 Spark资源分配／222 4.6.7 Spark Shuffle机制／224 4.6.8 Spark的算子调优／230 4.6.9 数据倾斜问题解析／231 4.7 本章总结／235 第5章数据可视化／237 5.1 图表类型／237 5.2 绘图原则／243 5.3 ECharts快速上手／247 5.3.1 ECharts引入／247 5.3.2 准备DOM容器／248 5.3.3 柱状图示例／249 5.4 本章总结／249 附录／250 附录A 笔面试真题／250

大数据分析师面试笔试宝典

库存： {{selectedSku?.stock}} 库存充足