您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
语料库与Python应用
字数: 236千字
装帧: 平装
出版社: 上海交通大学出版社
作者: 管新潮
出版日期: 2018-07-01
商品条码: 9787313197481
版次: 1
开本: 16开
页数: 211
出版年份: 2018
定价:
¥58
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书为“语料库翻译学文库”系列之一,是靠前靠前本介绍如何将Python编程工具融入语料库语言学和翻译学研究与应用的图书。它将如何习得Python的语料库编程能力分成三个层次,即靠前层次是Python基础性代码应用能力的习得,第二层次是针对特定问题的基础性代码组合应用能力的习得,第三层次是针对语料库研究和应用中出现的问题如何实现灵活运用Python编程工具的能力的习得。本书具有很强的可操作性,适用于语料库研究和教学,可提升语料库数据挖掘和分析的有效性。书中与语料库相关的代码均经过学生的测试,具有显著的适用性。本书采用案例形式进行解说,特别是第二和第三层次的案例均为作者实际科研和教学经验所得。本书读者对象为广大的文科生和从业者。
作者简介
管新潮,职业译者,长期从事德英汉翻译实践,至今已累计翻译和审校德英汉字数达3000万(包括审校);主要翻译领域涉及海洋工程与船舶制造(英语)、医学(英语)、法律(德语英语)、机电(德语)等;建有各类相关语料库,如英汉医学平行语料、英汉海洋工程平行语料库、英汉法律平行语料库、德汉合同文本平行语料库、马克思《资本论》德汉平行语料库(百年)、德语法院判决书语料库等。曾经或正在为靠前知名企业提供语言服务解决方案,如德国劳氏船级社、挪威船级社、艾斯维尔出版社、施普林格出版社、华为技术公司、毕马威咨询公司等。主要研究方向:语料库翻译学、翻译管理与技术、法律翻译、语料数据分析(Python)。现任上海交通大学外国语学院MTI导师。主持重量项目3个,发表论文15篇,出版专著2部、译著10部,拥有专利2项、软件著作权2项。
目录
第1章绪论
1.1语料库与Python
1.1.1语料库的若干维度
1.1.2语料库的技术实现
1.2本书概要
上篇语料文本的基础性代码
第2章语料文本的读取及其运行结果的输出
2.1概述
2.2语料文本的读取
2.2.1读取NLTK固有语料库
2.2.2读取自制语料库
2.2.3读取非独立存储的语料文本
2.2.4读取docx格式的语料文本
2.2.5读取xlsx格式的语料文本
2.3语料文本运行结果的输出
2.3.1操作界面直接输出结果
2.3.2输出txt文件格式
2.3.3输出xlsx文件格式
2.4中文语料文本的读取和结果输出
2.4.1自制语料库
2.4.2非独立存储的语料文本
第3章语料库应用的基础性代码
3.1概述
3.2停用词的使用
3.2.1不同语种的停用词
3.2.2自有停用词的设置
3.3文本降噪代码
3.3.1具体代码的功用
3.3.2组合使用代码的功用
3.3.3降噪与文本计数
3.4语料文本的语言学处理代码
3.4.1字母大小写转换
3.4.2词形还原
3.4.3文本分句或分词
3.4.4词性标注
3.5语料库词频排序
3.5.1简单词频排序
3.5.2降噪处理后词频排序
3.5.3清除停用词后排序
3.6语料库检索与统计
3.6.1上下文关键词检索
3.6.2类符形符比
3.6.3N连词提取
3.6.4指定词检索与统计
3.7中文语料文本的处理方法
3.7.1上下文关键词检索
3.7.2中文停用词
第4章数据可视化
4.1概述
4.2表格绘制
4.3图形绘制
4.3.1词频图形绘制
4.3.2柱状图和点状图绘制
4.4词云图绘制
4.4.1英文文本词云图
4.4.2中文文本词云图
第5章代码运行错误分析
5.1概述
5.2错误分析案例
5.2.1输入输出错误(IOError)
5.2.2对象属性错误(AttributeError)
5.2.3数据类型错误(TypeError)
5.2.4变量名称错误(NameError)
5.2.5索引错误(IndexError)
5.2.6缩进错误(IndentationError)
5.2.7参数类型错误(ValueError)
5.2.8语法错误(SyntaxError)
5.2.9Unicode解码错误(UnicodeDecodeError)
5.2.10关键字错误(KeyError)
中篇基础性代码的组合使用
第6章算法、代码与编程
6.1篇章结构
6.2算法和代码
6.2.1算法
6.2.2代码
6.3选择不同代码的影响
6.3.1分词处理方式对后续文本分析的影响
6.3.2不同的降噪效果
6.3.3链表、字符串、元组和字典对比
6.3.4停用词的功用
6.4Python与既有语料库工具的关系
第7章基础性代码的语料库组合应用
7.1以Excel文件格式输出术语(类符)
7.1.1简单输出术语
7.1.2按词频输出术语
7.2以Excel文件格式输出表格
7.3语篇词汇密度的计算
7.4语篇词汇复杂性的计算
7.5语篇词长分布的计算
7.6NLTK固有语料库
7.6.1总统就职演说语料库
7.6.2华尔街杂志语料库
7.6.3其他相关语料库介绍
下篇Python探索路径
第8章Python的语料库拓展应用
8.1概述
8.2单语语料导入Excel工作簿
8.3KWIC检索功能的拓展
8.4语篇词形还原
8.5术语提取效果的改进
8.6语篇段落对齐
8.7应用语言学文献计量研究的数据提取
8.8专业通用词的提取路径探索
附录1与本书相关的加载模块与函数命令对应表
附录2Python2和Python3部分代码对比
附录3部分NLTK固有语料库
附录4汉英对照术语表
索引
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网