您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
海量网络学术文献自动分类研究
字数: 210千字
装帧: 平装
出版社: 人民出版社
作者: 王效岳 等 著
出版日期: 2015-11-01
商品条码: 9787010148472
版次: 1
开本: 16开
页数: 245
出版年份: 2015
定价:
¥38
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
本书针对文本分类方法在发展过程中出现的问题,围绕“本体及其在文本分类中的应用”和“海量网络学术文献自动分类”两个方面展开探讨。深入研究了海量网络学术文献处理技术,比较分析了适合网络文献自动获取及并行处理的工具;设计了基于Heritrix与Hadoop平台的海量网络学术文献获取及并行处理模型和基于WordNet与SUMO本体集成的语义驱动自动文档分类模型;梳理了本体以及本体集成理论、方法和工具;开发了海量网络学术文献并行获取和自动分类原型系统。
作者简介
王效岳,男,1961年生,工学博士,教授,山东理工大学科技信息研究所所长。中国图书馆学会高等学校图书馆分会委员,山东省科技情报学会副理事长,山东省图书馆学会常务理事。研究方向为数据挖掘与信息处理技术。主编及参编学术著作6部,主持或参与重量课题3项、省部级课题6项、厅局级课题10余项,发表学术论文80余篇,其中被EI、CSSCI索引30余篇。授权发明专利3项。获省科技进步3等奖1项,厅局级科技进步2等奖2项、3等奖3项。
白如江,男,1979年生,管理学博士,副研究馆员,山东理工大学图书馆数字资源部主任。研究领域包括文本数据挖掘、自然语言处理、信息检索技术、高科技战略情报研究等。主持国家社科青年基金项目1项,教育部人文社会科学青年基金项目等省部级课题多项。获重量教学成果奖1项、省部级奖励多项,发表SCI、EI、CSSCI检索核心期刊论文30余篇。
目录
序
绪论
第一章网络爬虫
第一节网络爬虫
一、开源网络爬虫工具
二、爬虫工具比较分析
第二节Hadoop平台
一、Hadoop与其他系统的比较
二、Hadoop项目及结构
三、Hadoop分布式文件系统
四、MapReduce编程模型
五、Hadoop平台搭建
第二章海量网络学术文献获取及并行处理模型
第一节网络学术文献的主要来源及常用文件格式
一、网络学术文献的主要来源及特点
二、网络学术文献的常用文件格式
第二节网络学术文献自动获取实验
一、实验环境
二、实验平台搭建
第三节网络学术文献资源获取
一、网络学术文献获取方案
二、种子站点的选择
三、抓取任务的配置
四、文件类型和大小过滤
五、网络学术文献获取实验结果
第四节网络学术文献资源判定
第五节网络学术文献并行处理
一、数据预处理
二、并行处理
第六节MapReduce任务优化
一、任务调度
二、任务数量
三、Combine函数
四、文件压缩
五、重用JVM
六、网络学术文献并行处理模块实验结果
第三章本体集成
第一节本体研究
一、本体概念
二、本体基本构成要素
三、本体类型
四、本体表示语言
第二节本体库研究
一、国内外主要本体库
二、本体库比较分析
第三节本体集成基本过程
第四节本体集成工具
一、工具介绍
二、工具比较与分析
第五节本体集成方法
一、基于形式概念分析(FCA)的本体集成方法
二、基于范畴论的本体集成方法
三、基于RDFS图闭包的本体集成方法
第四章基于语义驱动文本自动分类研究
第一节文档自动分类基本理论
一、文档自动分类基本概念
二、文档自动分类基本流程
三、文档自动分类性能评价指标
第二节基于语义驱动文档自动分类概念
第三节基于语义驱动文档自动分类实现基础
第四节基于语义驱动文档自动分类方法模型
一、词向量空间构建
二、语义向量空间构建
第五章基于本体集成的文档语义分类模型
第一节SUMO和WordNet本体库概述
一、WordNet本体库
二、SUMO本体库
第二节WordNet与SUMO本体库映射机制研究
一、映射动机
二、映射模型
三、映射实例
四、映射效果及应用分析
第三节基于WordNet与SUMO本体集成文档语义分类模型设计与实现
一、实验平台构建
二、实验数据集及方法
三、集成本体库构建
四、词向量空间到概念向量空间的映射
五、概念向量空间通用化
六、分类模型训练与测试过程描述
七、实验评估指标
八、实验及结果分析
第六章海量网络学术文献自动分类系统
第一节海量网络学术文献自动分类系统
一、开发环境
二、海量网络学术文献自动获取模块
三、海量网络学术文献词一文档矩阵处理模块
四、本体集成模块
五、基于语义驱动的分类模块
第二节海量网络学术文献自动分类系统实现
一、系统主要技术及标准
二、系统功能
第七章总结及展望
第一节总结
第二节展望
附录A
附录B
附录C
附录D
参考文献
索引
后记
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网