您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
社交网站的数据挖掘与分析(原书第3版)
装帧: 平装
出版社: 机械工业出版社
作者: (美)马修·A.罗素,(美)米哈伊尔·克拉森
出版日期: 2021-02-01
商品条码: 9787111674047
版次: 1
开本: 16开
页数: 348
出版年份: 2021
定价:
¥119
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
编辑推荐
本书指导你挖掘隐藏在Twitter、Facebook、LinkedIn、Instagram和GitHub等流行社交网站上的丰富数据。通过这本畅销指南,数据科学家、分析师和程序员将学习如何在Jupyter Notebook或者Docker容器中使用Python代码分析社交媒体中的真知灼见——哪些人正在通过社交媒体进行联系?他们正在谈论什么?他们目前身在何处? 在本书的第壹部分,每一章都聚焦社交网站生态的某个具体方面,囊括了各大主流社交网站,也包括了网页、博客和订阅源、邮箱、GitHub以及新增加的Instagram的内容。第二部分提供了实用指南,其中包括超过20个供挖掘Twitter数据之用的简短代码解决方案。
内容简介
本书指导你挖掘隐藏在Twitter、Facebook、Linkedln、Instagram和GitHub等流行社交网站上的丰富数据。通过这本畅销指南,数据科学家、分析师和程序员将学习如何在JupyterNotebook或者Docker容器中使用Python代码分析社交媒体中的真知灼见——哪些人正在通过社交媒体进行联系?他们正在谈论什么?他们目前身在何处?在本书的第一部分,每一章都聚焦社交网站生态的某个具体方面,囊括了各大主流社交网站,也包括了网页、博客和订阅源、邮箱、GitHub以及新增加的Instagram的内容。第二部分提供了实用指南,其中包括超过20个供挖掘Twitter数据之用的简短代码解决方案。
目录
前言
第一部分社交网站导引
序幕
第1章挖掘Twitter:探索热门话题、发现人们的谈论内容等
1.1概述
1.2Twitter风靡一时的原因
1.3探索TwitterAPI
1.3.1基本的Twitter术语
1.3.2创建一个TwitterAPI连接
1.3.3探索热门话题
1.3.4搜索推文
1.4分析140字(或更多)的推文
1.4.1提取推文实体
1.4.2使用频率分析技术分析推文和推文实体
1.4.3计算推文的词汇丰富性
1.4.4检视转推模式
1.4.5使用直方图将频率数据可视化
1.5本章小结
1.6推荐练习
1.7在线资源
第2章挖掘Facebook:分析粉丝页面、查看好友关系等
2.1概述
2.2探索Facebook的图谱API
2.2.1理解图谱API
2.2.2理解开放图协议
2.3分析社交图谱联系
2.3.1分析Facebook页面
2.3.2使用pandas操作数据
2.4本章小结
2.5推荐练习
2.6在线资源
第3章挖掘Instagram:计算机视觉、神经网络、对象识别和人脸检测
3.1概述
3.2探索InstagramAPI
3.2.1建立InstagramAPI请求
3.2.2获取你自己的Instagram订阅源
3.2.3通过主题标签检索媒体
3.3Instagram帖子的剖析
3.4人工神经网络速成
3.4.1训练神经网络“看”图片
3.4.2手写数字识别
3.4.3使用预训练的神经网络在照片中识别物体
3.5神经网络在Instagram帖子中的应用
3.5.1标记图像内容
3.5.2在图像中检测人脸
3.6本章小结
3.7推荐练习
3.8在线资源
第4章挖掘LinkedIn:分组职位、聚类同行等
4.1概述
4.2探索LinkedInAPI
4.2.1发起LinkedInAPI请求
4.2.2下载LinkedIn的联系人并保存为CSV文件
4.3数据聚类速成
4.3.1对数据进行规范化处理以便进行分析
4.3.2测量相似度
4.3.3聚类算法
4.4本章小结
4.5推荐练习
4.6在线资源
第5章挖掘文本文件:计算文档相似度、提取搭配等
5.1概述
5.2文本文件
5.3TF-IDF简介
5.3.1词频
5.3.2逆文档频率
5.3.3TF-IDF
5.4用TF-IDF查询人类语言数据
5.4.1自然语言工具包概述
5.4.2对人类语言使用TF-IDF
5.4.3查找相似文档
5.4.4分析人类语言中的二元文法
5.4.5分析人类语言数据的反思
5.5本章小结
5.6推荐练习
5.7在线资源
第6章挖掘网页:使用自然语言处理理解人类语言、总结博客内容等
6.1概述
6.2抓取、解析和爬取网页
6.3通过解码语法来探索语义
6.3.1一步步讲解自然语言处理
6.3.2人类语言数据中的句子检测
6.3.3文档摘要
6.4以实体为中心的分析:范式转换
6.5人类语言数据处理分析的质量
6.6本章小结
6.7推荐练习
6.8在线资源
第7章挖掘邮箱:分析谁和谁说什么以及说的频率等
7.1概述
7.2获取和处理邮件语料库
7.2.1Unix邮箱指南
7.2.2获得Enron数据
7.2.3将邮件语料转换为Unix邮箱
7.2.4将Unix邮箱转换为pandasDataFrame
7.3分析Enron语料库
7.3.1根据日期/时间范围查询
7.3.2发件人/收件人通信的分析模式
7.3.3根据关键词查找邮件
7.4分析你自己的邮件数据
7.4.1通过OAuth访问你的Gmail
7.4.2获取和解析邮件
7.4.3Immersion对电子邮件的可视化模式
7.5本章小结
7.6推荐练习
7.7在线资源
第8章挖掘GitHub:检查软件协同习惯、构建兴趣图谱等
8.1概述
8.2探索GitHub的API
8.2.1建立GitHubAPI连接
8.2.2建立GitHubAPI请求
8.3使用属性图为数据建模
8.4分析GitHub兴趣图谱
8.4.1初始化一个兴趣图谱
8.4.2计算图的中心度度量
8.4.3为用户添加“关注”边来扩展兴趣图谱
8.4.4以节点为中心获得更高效的查询
8.4.5兴趣图谱的可视化
8.5本章小结
8.6推荐练习
8.7在线资源
第二部分Twitter数据挖掘与分析实用指南
第9章Twitter数据挖掘与分析
9.1访问Twitter的API(开发目的)
9.2使用OAuth访问Twitter的API(产品目的)
9.3探索流行话题
9.4查找推文
9.5构造方便的函数调用
9.6使用文本文件存储JSON数据
9.7使用MongoDB存储和访问JSON数据
9.8使用信息流API对Twitter数据管道抽样
9.9采集时序数据
……
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网