您好,欢迎来到聚文网。 登录 免费注册
大规模元搜索引擎技术(精)/大数据管理丛书

大规模元搜索引擎技术(精)/大数据管理丛书

  • 出版社: 机械工业
  • 作者: (美)孟卫一//於德|译者:朱亮
  • 商品条码: 9787111556176
  • 版次: 1
  • 开本: 16开
  • 页数: 143
  • 出版年份: 2017
  • 印次: 1
定价:¥69 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
孟卫一、於德著的《大规模元搜索引擎技术(精) 》广泛而深人地介绍了大规模元搜索引擎技术,详细 讨论了大规模元搜索引擎的主要部件——搜索引擎选 择、搜索引擎加入和结果合并,重点关注部件的高度 可扩展性和自动化解决方案。作为Web搜索的竞争技术 ,本书对大规模元搜索引擎技术的可行性进行了强有 力的论证。 本书可作为高等院校Web数据管理和信息检索等 Web技术相关课程的教材,也可作为Web搜索领域的研 究人员和开发人员的参考书。
作者简介
於德(Clement T.Yu),美国伊利诺伊大学芝加哥分校的计算机科学系教授。他的研究方向包括多媒体信息检索、元搜索引擎、数据库管理以及医疗保健应用。他在这些领域已经发表了200多篇论文,是《Principles of Database Query Processing for Advanced Applications》的合著者之一。他担任过ACM SIGIR的主席,作为分布式和异构环境及文档检索查询处理领域的专家顾问,具有丰富的经验。 孟卫一(Weiyi Meng),目前是美国纽约州立大学宾汉姆顿分校计算机科学系的教授。他于1992年获得美国伊利诺伊大学芝加哥分校计算机科学专业的博士学位。他已经发表了100多篇论文,是《Principles of Database Query Processing for Advanced Applications》的合著者之一。他担任过多个国际会议的主席或程序委员会主席,是50多个国际会议程序委员会的委员。他是《World Wide Web Journal》杂志的编委,并且是WAIM国际学术会议系列的指导委员会成员。近年来,他的研究方向为元搜索引擎、Web数据集成、基于因特网的信息检索、信息提取和情感分析。在大规模元搜索引擎方面,他做出了开创性的工作。他是一家因特网公司(Webscalers)的创始人之一并兼任该公司的总裁,该公司研发的AllInOneNews是世界上最大的新闻元搜索引擎。
目录
丛书前言 译者序 前言 作者简介 第1章 绪言 1.1 Web上查找信息 1.1.1 浏览 1.1.2 搜索 1.2 文本检索概述 1.2.1 系统体系结构 1.2.2 文档表示 1.2.3 文档-查询匹配 1.2.4 查询处理 1.2.5 检索有效性度量 1.3 搜索引擎技术概述 1.3.1 Web的专门特性 1.3.2 Web爬虫 1.3.3 利用标签信息 1.3.4 利用链接信息 1.3.5 结果组织 1.4 本书概述 第2章 元搜索引擎体系结构 2.1 系统体系结构 2.2 为什么使用元搜索引擎技术 2.3 挑战环境 2.3.1 异构及其影响 2.3.2 规范化研究 第3章 搜索引擎选择 3.1 粗糙表记方法 3.2 基于学习的方法 3.3 基于样本文档的方法 3.4 统计表记方法 3.4.1 D-WISE 3.4.2 CORI Net 3.4.3 gGIOSS 3.4.4 潜在有用文档数目 3.4.5 最相似文档的相似度 3.4.6 搜索引擎表记生成 第4章 搜索引擎加入 4.1 搜索引擎连接 4.1.1 搜索引擎的HTML表单标签 4.1.2 搜索引擎自动连接 4.2 搜索结果抽取 4.2.1 半自动包装器生成 4.2.2 自动包装器生成 第5章 结果合并 5.1 基于完全文档内容的合并 5.2 基于搜索结果记录的合并 5.3 基于结果本地排序的合并 5.3.1 基于轮转的方法 5.3.2 基于相似度转换的方法 5.3.3 基于投票的方法 5.3.4 基于机器学习的方法 第6章 总结与后续研究 参考文献

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网