您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
双语语料构建与双语文本聚类研究
字数: 218000
装帧: 平装
出版社: 南京大学出版社
作者: 章成志 等
出版日期: 2019-06-01
商品条码: 9787305223785
版次: 1
开本: 16开
页数: 184
出版年份: 2019
定价:
¥50
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书以多语言文本为研究对象,进行基于多语言文本的文本挖掘,涉及任务主要分为三块内容,多语言文本的采集,其中包括了平行语料和可比语料,对多语言语料的评估以及多语言文本的聚类。其中,多语言文本的聚类研究中,针对多语言文本的关键词抽取、平行语料和可比语料的文本聚类进行了相关实验。任务中主要针对中英文语料进行相关挖掘,实验中使用的研究方法具有普适性,可以运用到其他语种的文本挖掘中。
目录
第1章 绪论
1.1 研究背景
1.2 研究意义
1.3 研究内容框架
1.4 本书章节安排
第2章 相关研究工作综述
2.1 双语语料采集研究综述
2.1.1 基于网络资源的可比语料采集
2.1.2 基于平行网页的平行语料采集
2.2 可比语料评估研究综述
2.2.1 可比语料的可比度度量
2.2.2 跨语言文档相似度计算
2.3 多语言文本关键词抽取研究综述
2.3.1 候选关键词的选取
2.3.2 有监督的关键词抽取方法
2.3.3 无监督的关键词抽取方法
2.4 多语言文本聚类研究综述
2.4.1 文本表示模型
2.4.2 文本聚类算法
2.4.3 多语言文本聚类
第3章 双语语料采集与构建研究
3.1 双语平行网页发现
3.1.1 总体流程与关键技术
3.1.2 网页结果评估与分析
3.2 双语可比语料构建
3.2.1 总体流程与关键技术
3.2.2 可比语料构建结果与分析
3.3 本章小结
第4章 双语可比语料评估研究
4.1 可比语料可比度度量
4.1.1 总体流程与关键技术
4.1.2 可比度度量结果与分析
4.2 可比语料的评估
4.2.1 总体流程与关键技术
4.2.2 语料评估结果与分析
4.3 本章小结
第5章 双语文本关键词挖掘研究
5.1 关键词分布特点分析
5.1.1 中文关键词分布特点分析
5.1.2 英文关键词分布特点分析
5.2 关键词抽取方法思路与关键技术
5.2.1 关键词抽取总体流程
5.2.2 关键词抽取中的特征计算方法
5.3 实验与结果分析
5.3.1 特征归一化与结果评价
5.3.2 中文关键词抽取实验结果
5.3.3 英文关键词抽取实验结果
5.4 本章小结
第6章 双语文本聚类研究
6.1 平行语料聚类研究
6.1.1 平行语料聚类的总体流程
6.1.2 中英文平行语料聚类的关键技术
6.1.3 文本聚类结果与分析
6.2 可比语料聚类研究
6.2.1 可比语料聚类的总体流程
6.2.2 中英文可比语料聚类的关键技术
6.2.3 文本聚类结果与分析
6.3 本章小结
第7章 结束语
7.1 总结
7.2 未来研究工作
7.2.1 双语语料采集与构建
7.2.2 双语可比语料评估
7.2.3 双语文本关键词抽取与双语文本聚类
附录
附录A 基于搜索引擎方法采集可比语料的种子词对示例
附录B Wikipedia可比语料采集种子词样例
附录C Wikipedia可比语料中的对齐标题(部分)
附录D 图情核心期刊在CNKI(19982011)中的检索结果
附录E 图书情报期刊在EBSCO数据库中检索和下载情况
附录F 基于传统统计和词频统计的语料相似度结果
附录G 基于术语度的可比语料与其他领域语料比较结果
参考文献
索引
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网