您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
网络数据爬取与分析实务(电子商务应用型专业系列教材)
字数: 301
出版社: 上海交大
作者: 编者:李周平
商品条码: 9787313200327
版次: 1
开本: 16开
页数: 244
出版年份: 2018
印次: 1
定价:
¥68
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
李周平编著的《网络数据爬取与分析实务》按 照网络数据爬取、数据清洗与处理、数据存储、数 据分析的逻辑脉络,介绍了数据科学的相关知识。 全书主要内容涉及理论、实战、工具三个层面。其 中,理论层面主要介绍了网络爬虫,数据处理与存 储,机器学习的相关概念、原理与算法;实战层面 主要通过影评、二手房、招聘网站等实战项目,阐 述了数据爬取、处理与存储的代码实现,并通过相 关数据集的实例,介绍了机器学习算法的实现与效 果评估;工具层面主要讲解了如何通过Python的 Urllib、Request、BeaulifulSoup、Pandas、 Scikit一learn等第三方工具包实现数据的爬取、处 理与分析,以及通过SQLite这一轻量级数据库工具 实现数据的存储。 本书可作为高校开设数据科学相关课程的教学 用书,也可供数据科学相关方向初学者的学习参考 。
目录
第1章 数据科学概述 1.1 什么是数据科学 1.1.1 数据科学的概念 1.1.2 数据科学的处理流程 1.2 数据分析师、数据工程师与数据科学家 1.2.1 数据分析师 1.2.2 数据工程师 1.2.3 数据科学家 第2章 Python语法基础 2.1 Python的程序结构 2.1.1 Python文件类型 2.1.2 包、模块、函数结构 2.2 Python编码规范 2.2.1 通过缩进规范编码的层次关系 2.2.2 代码注释 2.2.3 语句的分隔 2.2.4 变量赋值及作用范围 2.3 Python编程环境的搭建 2.3.1 Python的版本 2.3.2 Python集成开发工具 2.3.3 JupyterNotebook的使用 2.4 Python的数据结构 2.4.1 列表(List) 2.4.2 字典(Dictionarv) 2.4.3 元组(Tuple) 2.5 Python控制语句 2.5.1 条件选择语句 2.5.2 循环语句 2.5.3 异常处理语句 习题 第3章 使用Urllib库编写爬虫 3.1 网络爬虫概述 3.1.1 什么是网络爬虫 3.1.2 为什么要学习网络爬虫技术 3.1.3 聚焦爬虫的基本原理 3.2 使用Urllib.request模块编写爬虫 3.2.1 Urllib库简介 3.2.2 编写第一个爬虫程序 3.2.3 urlopen()函数超时设置 3.3 修改User-Agent属性模拟浏览器访问 3.3.1 认识HTTP协议的User-Agent属性 3.3.2 修改User-Agent属性的方法 3.4 HTTP协议详解 3.4.1 HTTP请求与应答过程 3.4.2 HTTP请求格式 3.5 模拟HTTP—GET方法的爬虫 3.6 模拟HTTP-POST方法的爬虫 3.6.1 Urllib.request.Request类 3.6.2 POST请求过程 3.6.3 爬虫模拟POST登录请求 习题 第4章 使用正则表达式提取数据 4.1 正则表达式原理 4.2 正则表达式语法 4.2.1 正则表达式的构成 4.2.2 贪婪与懒惰模式 4.3 re模块常用的函数 4.3.1 常用的匹配函数 第5章 使用BeautifulSoup库提取数据 第6章 爬虫项目实战 第7章 Pandas数据处理基础 第8章 Pandas数据处理常用方法 第9章 数据处理实战 第10章 SQLite数据库操作 第11章 机器学习概述 第12章 从线性回归到分类 第13章 分类模型及应用 第14章 分类模型的评估
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网