您好,欢迎来到聚文网。 登录 免费注册
Python网络爬虫与数据分析从入门到实践

Python网络爬虫与数据分析从入门到实践

  • 字数: 404
  • 出版社: 清华大学
  • 作者: 马国俊|责编:王金柱
  • 商品条码: 9787302627814
  • 版次: 1
  • 开本: 16开
  • 页数: 227
  • 出版年份: 2023
  • 印次: 1
定价:¥79.8 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书从初学者的视角出 发,以案例实操为核心,系 统地介绍网络爬虫的原理、 工具使用与爬取技术,并详 细讲解数据分析的各种技巧 。本书主要内容包括: Python基础语法,数据分析 工具NumPy、Pandas、 Matplotlib的使用,网络爬 虫库Urllib、BeautifulSoup 、Scrapy,正则表达式在网 络爬虫中的应用,数据预处 理与数据分析方法、中文文 本处理、文本向量化技术, 以及机器学习算法在数据分 析中的应用。书中还给出了 大量案例和项目,可以帮助 读者快速上手,提高实用技 能。 本书内容丰富,注重实 操,适用于网络爬虫岗位、 数据分析岗位的初级工程师 和各类工程技术人员,还可 作为高校经济、管理、人文 社科、大数据等专业的教学 用书。
作者简介
马国俊,计算专业硕士,教授,从业20余年,主要从事大数据技术的教学、项目开发与研究工作,先后在国内外刊物发表学术论文40余篇,获取软件著作权3项;主持、参与各类项目5项,获得奖项若干。
目录
第1章 Python基础语法 1.1 搭建Python开发环境 1.1.1 安装Python解释器 1.1.2 安装第三方开发包 1.1.3 在PyCharm里设置解释器 1.1.4 在PyCharm里新建项目和文件 1.2 Python语法入门 1.2.1 Python常量和变量 1.2.2 基本数据类型 1.2.3 字符串 1.2.4 单行注释和多行注释 1.2.5 条件分支语句 1.2.6 循环语句 1.2.7 break和continue 1.2.8 格式化输出 1.3 函数及用法 1.3.1 定义和调用函数 1.3.2 return关键字 1.3.3 递归调用函数 1.4 函数的特殊操作 1.4.1 参数是函数 1.4.2 返回结果是函数 1.4.3 匿名函数(Lambda表达式) 1.5 Python的数据结构 1.5.1 列表及其用法 1.5.2 元组及其用法 1.5.3 字典及其用法 1.6 动手练习 第2章 数据科学库之NumPy 2.1 NumPy库中的ndarray对象 2.1.1 如何创建ndarray 2.1.2 用dtype参数指定数据类型 2.1.3 创建全0或全1的ndarray 2.2 NumPy常见操作 2.2.1 用arange创建序列 2.2.2 常用的数学运算 2.2.3 NumPy的科学计算函数 2.2.4 NumPy的聚合统计函数 2.3 索引和切片操作 2.3.1 索引操作 2.3.2 布尔索引与过滤数据 2.3.3 切片操作中的内存共享问题 2.3.4 copy函数与创建副本 2.4 动手练习 第3章 数据处理库之Pandas 3.1 Series对象及操作 3.1.1 Series常规操作 3.1.2 Series抽样操作 3.1.3 Series索引操作 3.1.4 Series切片操作

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网