您好,欢迎来到聚文网。 登录 免费注册
Python快乐编程——数据分析与实战

Python快乐编程——数据分析与实战

  • 字数: 470
  • 出版社: 清华大学
  • 作者: 千锋教育高教产品研发部
  • 商品条码: 9787302563785
  • 版次: 1
  • 页数: 303
  • 出版年份: 2021
  • 印次: 1
定价:¥69.9 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书从数据挖掘的应用出发,以电力、航空、医疗、互联网、生产制造以及公共服务等行业真实案例为主线,深入浅出介绍Python数据挖掘建模过程,实践性极强。本书以数据挖掘建模工具Python语言来展开,先介绍案例背景提出挖掘目标,再阐述分析方法与过程,最后完成模型构建,在介绍建模过程中穿插操作训练,把相关的知识点嵌入相应的操作过程中,使读者轻松理解并掌握相关的理论和知识点。本书适用于对数据分析有浓厚兴趣但不知从何下手的初学者,也可以作为本科生、研究生以及科研人员学习Python的基础教材。
作者简介
胡耀文,2014年--2016年连续三年获得微软全球MVP最有价值专家,清华大学出版社技术编审委员会委员,2009年参与国庆60周年官兵电子纪念册项目,CSDN著名技术专家,博客浏览量超过1460350次,2012年7月 出版Windows CE 7开发实战详解,2013年5月出版Windows8开发权威指南。
目录
第1章 数据分析概述 1.1 初步认识数据分析 1.2 数据分析的基本流程 1.3 Python数据分析的工具 1.4 Jupyter Notebook的基本使用 1.4.1 下载与安装 1.4.2 功能界面 1.4.3 工作原理 1.4.4 基本使用 1.4.5 高级操作 小结 习题 第2章 IPython的使用 2.1 IPython基础 2.1.1 IPython简介 2.1.2 IPython使用技巧 2.1.3 IPython魔术命令 2.2 IPython中的开发工具 2.2.1 调试器 2.2.2 性能分析 小结 习题 第3章 NumPy的使用 3.1 数组的使用 3.1.1 数组的创建 3.1.2 数组的属性 3.1.3 数组的运算 3.1.4 数组的索引 3.1.5 数组的变换 3.2 矩阵的使用 3.2.1 矩阵的创建 3.2.2 矩阵的合并 3.2.3 矩阵的运算 3.2.4 矩阵的属性 3.3 NumPy实用技巧 3.3.1 通用函数的使用 3.3.2 数据的保存和读取 3.3.3 随机数生成 3.3.4 NumPy与数据统计 小结 习题 第4章 Pandas的使用 4.1 Pandas的数据结构 4.1.1 Series对象的创建 4.1.2 Series对象的属性 4.1.3 DataFrame对象的创建 4.1.4 DataFrame对象的属性 4.2 Pandas的索引对象 4.2.1 Series 索引的基本使用 4.2.2 重建索引 4.2.3 索引的基本选取和过滤 4.3 Pandas的基本计算 4.3.1 算术运算和数据对齐 4.3.2 自定义函数 4.3.3 排序 4.3.4 重复索引的基本使用 4.4 Pandas的统计功能 4.4.1 统计使用的基本函数 4.4.2 常用统计方法 4.5 Pandas的数据缺陷处理 4.5.1 dropna处理Series数据缺陷 4.5.2 dropna处理DataFrame数据缺陷 4.5.3 fill进行数据添加 4.6 Pandas的层次化索引 4.6.1 基本创建 4.6.2 重排分级 4.6.3 根据级别进行汇报 4.6.4 DataFrame数据列的使用 4.7 Pandas的文件读取 4.7.1 读取/存储Excel文件 4.7.2 读取/存储CSV文件 4.7.3 读写数据库 4.7.4 读取HDF5文件 小结 习题 第5章 Matplotlib的使用 5.1 Matplotlib绘图流程 5.2 Matplotlib基本使用 5.2.1 创建画布 5.2.2 添加子图 5.2.3 规定刻度与标签 5.2.4 添加图例 5.2.5 显示 5.3 Matplotlib常用技巧 5.3.1 配置文件 5.3.2 rc参数的基本配置 5.3.3 中文显示配置 5.4 Matplotlib基本图形 5.4.1 Matplotlib绘制散点图 5.4.2 Matplotlib绘制直方图 5.4.3 Matplotlib绘制饼状图 5.4.4 Matplotlib绘制折线图 5.4.5 Matplotlib绘制箱型图 小结 习题 第6章 时间序列分析 6.1 时间对象——Timestamp 6.1.1 创建时间戳 6.1.2 指定与转换时区 6.1.3 最小时间/最大时间 6.1.4 常用属性 6.2 时间对象——Period 6.2.1 Period对象的创建 6.2.2 Period对象的属性 6.2.3 Period对象的方法 6.3 时间对象——Timedelta 6.3.1 Timedelta对象的创建 6.3.2 Timedelta对象的属性 6.3.3 Timedelta对象的方法 6.3.4 时间间隔的基本运算 6.4 DateTimeIndex对象 6.4.1 DateTimeIndex对象的创建 6.4.2 DateTimeIndex对象的属性 6.4.3 DateTimeIndex对象的方法 6.5 PeriodIndex对象 6.5.1 PeriodIndex对象的创建 6.5.2 PeriodIndex对象的属性 6.5.3 PeriodIndex对象的方法 6.6 TimedeltaIndex对象 6.6.1 TimedeltaIndex对象的创建 6.6.2 TimedeltaIndex对象的属性 6.6.3 TimedeltaIndex对象的方法 6.7 采样 6.7.1 采样的基本方法 6.7.2 降采样 6.7.3 升采样 小结 习题 第7章 数据处理的基本手段 7.1 合并数据集 7.1.1 主键合并数据 7.1.2 轴向数据合并 7.1.3 重叠数据的合并 7.1.4 索引键的合并 7.2 数据清洗 7.2.1 重复值的处理 7.2.2 异常值的处理 7.2.3 缺失值的处理 7.3 数据标准化 7.3.1 最小最大标准化 7.3.2 Zscore标准化 7.3.3 按小数定标标准化 7.4 数据类型的转换 7.4.1 离散化连续数据 7.4.2 哑变量处理类型数据 小结 习题 第8章 基于文本的自然语言分析 8.1 基于文本的自然语言处理概述 8.2 Jieba基本介绍和使用 8.2.1 基本介绍 8.2.2 安装 8.2.3 基本使用 8.3 NLTK的基本介绍和使用 8.3.1 NLTK的基本介绍 8.3.2 NLTK的安装 8.3.3 NLTK基本使用 8.4 文本相似度 8.4.1 相似度分析 8.4.2 基于NLTK的文本相似度分析 8.4.3 基于Gensim的文本相

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网