您好,欢迎来到聚文网。 登录 免费注册
Python与数据科学

Python与数据科学

  • 字数: 504000
  • 装帧: 平装
  • 出版社: 清华大学出版社
  • 出版日期: 2022-01-01
  • 商品条码: 9787302599968
  • 版次: 1
  • 开本: 16开
  • 页数: 340
  • 出版年份: 2022
定价:¥59.9 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
"1.从实际教学中总结而来,从内容选取、引入和展开的编排上更为适合学习和理解; 2.图表、示例丰富,使内容更容易理解和掌握,学习过程更加生动; 3.合理配置Python基础与数据科学计算和分析处理内容的篇幅,方便读者学习、使用; 4.组织、列举多种数据科学范畴的处理方法和内容,便于读者采用多种方法完成数据分析和处理,并进行比较选择; 5.提供示例、实验代码和素材,便于完成实践,掌握知识和技能。 "
内容简介
本书介绍了Python编程语言的主要规范、语法和结构等内容,强调Python在数据分析、数据处理和数据组织结构中的应用,以建立起运用Python语言进行数据处理的基础。本书以实现数据处理任务为索引,系统介绍进行计算机系统操作及文件读写、数据的可视化、科学计算、图像处理、数据生成和数据分析等任务的实现方法,涉及NumPy、pandas、matplotlib、sklearn、SciPy等扩展模块库的核心内容。涉及面广。 本书示例丰富,便于学习者学习和掌握,可作为高等院校计算机科学与技术、信息管理、数据分析等相关专业的教科书,也可作为信息分析人员的技术参考书籍。
作者简介
"葛东旭,男,55岁,硕士研究生,高级工程师。工作单位:南京审计大学金审学院,教师; 近期出版:《数据挖掘原理与应用》(2020年) 《传感器检测与应用》(2012年) 《Microsoft Office高级应用教程 》(2020年); 研究方向:数据挖掘、数据分析、信息管理、信息系统等; 讲授课程:数据挖掘、Python与数据科学、信息资源管理导论、运筹与决策、计算机组成原理、信息系统项目管理等;"
目录
第1章Python介绍及安装1
1.1Python发展史1
1.2Python的特性2
1.3安装Python开源软件3
1.3.1下载并安装3
1.3.2设置环境变量4
1.3.3运行Python4
1.3.4运行Python脚本文件6
1.4安装实用工具包7
1.4.1setuptools7
1.4.2easy_install7
1.4.3pip9
1.5安装基础模块库13
1.6安装集成开发环境13
1.6.1IDLE13
1.6.2Spyder15
1.6.3PyCharm15
1.6.4PythonWin18
练习118
参考文献19
第2章Python语言基础20
2.1Python语句书写20
2.1.1语句书写规则20
2.1.2语句书写格式20
2.2基本数据类型24
2.2.1数值类型24
2.2.2字符串类型24
2.2.3布尔类型25
2.2.4“空”类型25
2.3标识符与变量25
2.3.1标识符与变量的命名25
2.3.2变量的赋值及变量值传递26
2.4运算及运算符27
2.4.1算术运算符27
2.4.2赋值运算符28
2.4.3位运算符28
2.4.4比较运算符29
2.4.5逻辑运算符29
2.4.6字符串运算符30
2.4.7成员运算符30
2.4.8身份运算符30
2.4.9运算符的优先级31
2.4.10运算中数据类型的转换31
Python与数据科学 目录 2.5程序结构32
2.5.1选择结构32
2.5.2循环结构34
2.5.3异常处理结构try…except语句36
2.6面向对象37
2.6.1类的定义与使用37
2.6.2方法与属性38
2.7常用内置函数38
2.7.1数学运算38
2.7.2类型转换40
2.7.3序列操作44
2.7.4对象操作46
2.7.5反射操作49
2.7.6变量操作51
2.7.7交互操作52
2.7.8文件操作53
2.7.9编译执行53
2.7.10装饰器54
2.8函数55
2.8.1声明函数56
2.8.2变量作用域56
2.8.3递归函数57
2.9数据结构58
2.9.1字符串59
2.9.2列表65
2.9.3元组71
2.9.4集合72
2.9.5映射(字典)75
2.9.6数组78
2.9.7矩阵85
2.9.8Series89
2.9.9DataFrame92
练习2104
参考文献107
第3章系统与文件操作108
3.1系统操作108
3.1.1获取操作系统环境变量108
3.1.2获取操作系统信息109
3.2文件系统操作110
3.3文本文件读写114
3.3.1标准I/O读写114
3.3.2结构化文件读写119
3.4CSV文件读写121
3.4.1csv模块库121
3.4.2pandas模块库122
3.5MS Word文档读写124
3.5.1创建Word文档124
3.5.2读取Word文档128
3.6MS Excel文档读写131
3.6.1pandas模块库131
3.6.2xlsxwriter模块库134
3.6.3xlwt模块库(创建文件)135
3.6.4xlrd模块库(读取文件)136
3.6.5OpenPyxl模块库137
3.7MS PPT文档读写138
练习3143
参考文献145
第4章数据可视化146
4.1matplotlib模块库绘图146
4.1.1Figure147
4.1.2Axes149
4.1.3散点图154
4.1.4折线图158
4.1.5饼图161
4.1.6柱形图163
4.1.7箱线图166
4.1.8茎叶图168
4.1.9矩阵图170
4.1.10等高线图171
4.1.11三维图形173
4.1.12图形装饰176
4.2pyecharts模块库绘图178
4.3NetworkX绘图182
4.4绘制动态图184
练习4185
参考文献189
第5章科学计算190
5.1数值计算190
5.1.1积分190
5.1.2卷积192
5.2线性代数194
5.2.1求逆矩阵194
5.2.2求矩阵积194
5.2.3点积195
5.2.4内积196
5.2.5外积197
5.2.6叉乘197
5.2.7计算行列式198
5.2.8计算特征值和特征向量198
5.2.9奇异值分解199
5.2.10小二乘法200
5.2.11求解线性方程201
5.3规划问题求解202
5.3.1SciPy模块库求解202
5.3.2cvxpy模块库求解206
5.4非线性方程计算和求解210
5.4.1一元多次方程210
5.4.2非线性方程212
5.5信号处理214
5.5.1傅里叶变换214
5.5.2滤波216
练习5217
参考文献219
第6章图像处理220
6.1SKImage模块库220
6.1.1载入内置图片221
6.1.2图像读入、显示和保存222
6.1.3图像数据类型及颜色空间转换223
6.1.4图像像素访问与裁剪226
6.1.5图像缩放228
6.1.6图像旋转231
6.1.7对比度与亮度调整231
6.1.8绘制色阶图234
6.1.9直方图均衡化236
6.2OpenCV模块库238
6.2.1图像读入、显示和保存238
6.2.2通道的拆分/合并处理240
6.2.3图像颜色空间转换240
6.2.4缩放、平移、旋转242
6.2.5仿射变换244
6.2.6图像滤波246
6.2.7图像添加边框246
练习6247
参考文献248
第7章数据生成249
7.1数据生成和载入249
7.1.1生成数据序列249
7.1.2生成随机数据251
7.1.3载入sklearn实验数据集253
7.2数据库访问255
7.2.1访问MySQL数据库255
7.2.2访问SQL Server数据库256
练习7258
参考文献259
第8章数据分析260
8.1统计分析260
8.1.1描述性统计260
8.1.2汇总统计264
8.1.3参数估计与假设检验272
8.1.4词云278
8.1.5相关性分析282
8.2数据解析284
8.2.1主成分分析(PCA)284
8.2.2因子分析(FA)285
8.2.3独立成分分析(ICA)288
8.2.4特征选择290
8.3回归分析294
8.3.1线性回归295
8.3.2非线性回归303
8.4时间序列分析306
8.4.1序列检验和分析306
8.4.2趋势、周期性和残留分析312
8.4.3移动平均(MA)313
8.4.4自回归模型(AR)314
练习8323
参考文献326
摘要
     第3 章系统与文件操作 Python语言可以结合丰富的模块库,完成对计算机系统、计算机文件系统的管理和控 制,也可以方便地对多种常见文档进行操作,大大提升办公自动化的效率。 3.1系统操作 3.1.1获取操作系统环境变量 调用os模块库的getenv()函数,可以获取系统中用户变量或系统变量的设置内容。其 原型为: os.getenv(key, default=None) 其中,参数key为用户配置和系统配置的环境变量项①名称。例如: >>> import os >>> os.getenv('HOMEPATH') '\\Users\\Administrator' >>> os.getenv('windir') 'C:\\windows' >>> os.getenv('pathext') '.COM;.EXE;.BAT;.CMD;.VBS;.VBE;.JS;.JSE;.WSF;.WSH;.MSC' 此外,也可以使用os.environ[]获取环境变量。例如: >>> os.environ['PATH'] 'C:\\Windows\\system32;C:\\Windows;C:\\Windows\\System32\\Wbem;C:\\Windows\\ System32\\WindowsPowerShell\\v1.0\\;C:\\Users\\Administrator\\AppData\\Local\\ ① 环境变量项,可以通过在桌面右击选择“属性”→“高级系统设置”→“高级”→“环境变量”,在“环境变量”对话框 中进行查看和设置。 第3 章系统与文件操作 Programs\\Python\\Python38;C:\\Users\\Administrator\\AppData\\Local\\Programs \\Python\\Python38\\Scripts; C: \\Program Files (x86) \\Graphviz2.38\\bin; C: \\ Program Files\\WinRAR;C:\\Program Files (x86)\\Graphviz2.38\\bin' 3.1.2获取操作系统信息 调用platform 模块库所提供的各项函数,可以获得操作系统的信息。这些函数包括: platform()函数获取操作系统名称及版本号,version()函数获取操作系统版本号, architecture()函数获取操作系统的位数,machine()函数获取计算机类型,node()函数获取 计算机的网络名称,processor()函数获取处理器信息,system()函数获取操作系统信息, uname()函数获取综合信息。例如: >>> import platform >>> platform.platform() #获取操作系统名称及版本号 'Windows-7-6.1.7601-SP1' >>> platform.version() #获取操作系统版本号 '6.1.7601' >>> platform.architecture() #获取操作系统的位数 ('64bit', 'WindowsPE') >>> platform.machine() #获取计算机类型 'AMD64' >>> platform.node() #获取计算机的网络名称 'SC-202008041040' >>> platform.processor() #获取处理器信息 'Intel64 Family 6 Model 37 Stepping 5, GenuineIntel' >>> platform.system() #获取操作系统信息 'Windows' >>> platform.uname() uname_result(system='Windows', node='SC-202008041040', release='7', version= '6.1.7601', machine= 'AMD64', processor= 'Intel64 Family 6 Model 37 Stepping 5, GenuineIntel') 此外,sys模块库中也提供了多项能够报告操作系统和Python系统各种信息的属性, 可以在导入sys库后,使用dir(sys)来查看这些属性。 109 Python 与数据科学 3.2文件系统操作 os模块库中包含了一些对文件系统进行操作的函数,其中包括对文件夹及对文件的操 作。在导入os模块库后,通过执行dir(os)和dir(os.path)语句,可以查看其模块和函数的 名称。这里就其中几个常用的函数做详细介绍。 1.获取当前工作路径 调用os.getcwd()函数可获得当前的工作路径,注意当前路径并不是指脚本所在的路 径,而是所运行脚本的路径(二者经常会是一致的)。例如: >>> import os >>> print(os.getcwd()) C:\Users\Administrator\AppData\Local\Programs\Python\Python38 如果将上述两条语句内容写入Python程序文件cwd.py,并保存在E:\code文件夹下, 运行Windows的命令行窗口并进入E:\code文件夹,输入: E:\code> python pwd.pyencoding='utf-8') 否则在打开一个中文文本文件并尝试读取其中文本时,会抛出UnicodeDecodeError异 常。另外,可以使用codecs模块库读取不同编码的文本(示例代码见文件code_codecs_read _utf8.py)。 3.3.2结构化文件读写 可以使用NumPy和pandas模块库中的相应函数,从结构化的文本文件中读取数据, 并以numpy.ndarray或pandas.DataFrame等结构来组织数据。 1.NumPy模块库 调用numpy.loadtxt()函数,可以读入文本文件中的内容,并将其组织成numpy. ndarray数据类型的数据。其原型为: numpy.loadtxt(fname, dtype= < class 'float'>, comments= '# ', delimiter= None, converters= None, skiprows = 0, usecols = None, unpack = False, ndmin = 0, encoding='bytes', max_rows=None) 其中主要参数的说明见表

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网