您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
数据采集与处理:基于Python
出版社: 中国人民大学
作者: 付东普
商品条码: 9787300325682
版次: 1
出版年份: 2024
印次: 1
定价:
¥39
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书的主旨是介绍如何结合Python3语言进行各类结构化和非结构化数据的采集、预处理和存储,涉及统计概率、数据格式与编码、网页开发、自然语言处理、数据科学等不同领域的内容。全书共分为11章,包括数据科学概述、Python基础、统计与概率基础、文件读写与操作、数据可视化、网络数据爬取等多个主题。内容覆盖本地文件、网页数据、大数据访问等编程中的主要知识和技术,在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示了数据采集、处理与存储的核心流程。本书适合高等院校计算机、数据科学与大数据技术、软件工程、统计等相关专业的师生以及Python语言初学者、网络爬虫技术爱好者、数据分析从业人士阅读。
作者简介
付东普,首都经济贸易大学管理工程学院副教授,中国人民大学管理学博士,北京交通大学应用经济学博士后,高级系统架构设计师。研究领域包括电子商务、消费者行为和互联网金融,讲授课程包括数据分析理论与实践、数据采集与存储、互联网金融、管理信息系统、现代软件工程等。在《管理科学学报》《经济管理》《经济与管理研究》、Electronic Commerce Research等国内外学术期刊及国际会议发表论文20余篇,出版专著2部。有十多年软件开发、设计和管理经验,成功完成了多个数据分析项目。
目录
第一章 概 述
第一节 数据科学概述
第二节 数据采集概述
第三节 数据存储概述
第四节 Python相关数据科学工具
思考与练习
延伸阅读材料
第二章 Python基础
第一节 Python简介
第二节 Python基本语法与命令
第三节 运算符、表达式与内置对象
第四节 函数
第五节 异常及其处理
思考与练习
延伸阅读材料
第三章 numpy与pandas基础
第一节 numpy基础
第二节 pandas基础
思考与练习
延伸阅读材料
第四章 数据可视化
第一节 数据可视化概述
第二节 matplotlib绘图工具
第三节 其他数据可视化工具
思考与练习
延伸阅读材料
第五章 文件读写与操作
第一节 文件读写基本操作
第二节 CSV文件读写
第三节 XML文件读写
第四节 JSON文件读写
第五节 HDF文件读写
第六节 Office文件读写
第七节 PDF文件读写
第八节 图像文件读写
思考与练习
延伸阅读材料
第六章 统计与概率基础
第一节 统计基础
第二节 概率与分布
思考与练习
延伸阅读材料
第七章 数据清洗与预处理
第一节 数据清洗
第二节 数据整合
第三节 数据变换
第四节 聚合与分组统计
第五节 数据归约
思考与练习
延伸阅读材料
第八章 网络数据采集
第一节 爬虫的相关概念与知识
第二节 HTML与JavaScript基础
第三节 静态网页内容爬取与解析
第四节 动态网页内容爬取
第五节 爬虫框架Scrapy与应用
思考与练习
延伸阅读材料
第九章 关系型数据库连接与访问
第一节 关系型数据库概述
第二节 SQLite数据库连接与访问
第三节 MySQL数据库连接与访问
思考与练习
延伸阅读材料
第十章 大数据存储与访问技术
第一节 大数据技术
第二节 非关系型数据库简介
第三节 MongoDB数据库连接与访问
思考与练习
延伸阅读材料
第十一章 数据集成与ETL技术
第一节 数据集成
第二节 ETL相关技术与工具
思考与练习
延伸阅读材料
参考文献
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网