您好,欢迎来到聚文网。 登录 免费注册
Lucene搜索引擎开发进阶实战

Lucene搜索引擎开发进阶实战

  • 装帧: 平装
  • 出版社: 机械工业出版社
  • 作者: 成龙 著 著
  • 出版日期: 2015-01-01
  • 商品条码: 9787111488422
  • 版次: 1
  • 开本: 16开
  • 页数: 219
  • 出版年份: 2015
定价:¥59 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
随着信息时代的快速发展,搜索引擎的相关技术也越来越受到关注。各个领域都在争相引入和开发符合自身需求的搜索引擎,并投入大量人力、物力和财力来对其进行研究,从而寻找技术性的突破。对于开发人员来说,如何高效、顺利地实现搜索引擎开发,如何正确地应用搜索引擎开发符合需求的产品,如何快速地学习和提升自身的技能等是他们希望了解和掌握的内容。《Lucene搜索引擎开发进阶实战》立足于这些疑问,通过系统化的概念引导,辅以开发实战案例,并结合一些代码片段,来帮助读者掌握并运用Lucene进行搜索引擎开发。
内容简介
全书共12章,首先是基础知识的引导性介绍(包括了1~2章),其中第1章通过简单介绍了网络爬虫和Web搜索。第2章主要讲解了Lucene的概念、架构认知;第3章主要通过对文本进行索引,创建了一个小实例,并对其中的一些方法和类进行了介绍;从第4章开始将进入正题,将基于数据库搜索创建搜索引擎实例,并分析技术疑难问题。第4章建立了工程类的索引,进行详细的分析和解析;第5章则是细分内容,对创建索引中的分词技术独章论述,进行了分析;第6章对在创建索引过程中的jar包进行了解析;第7章继续深入,让索引技术走上了界面,成了应用程序的好帮手。第8章和第9章则是分别就搜索引擎中的很重要的两个关键技术—查询方法和高亮显示进行了详细的分析和介绍,提供了一个直观的认识和架构;第10章介绍了查询结果排序和词频统计的相关知识;第11章介绍了性能优化,包括代码优化,索引优化以及备份和恢复等相关知识;第12章将对目前的一些技术作了一个总结,对一些未来的技术发展作了一个展望。
作者简介
成龙,软件开发工程师,从事Lucene相关搜索引擎开发多年,曾在医药、教育等行业参与开发多个搜索引擎类项目,目前在进行一个搜索引擎项目的优化和二次开发工作,具有丰富的搜索引擎方向项目开发经验。工作之余也喜欢钻研疑难问题,并在实践验证后形成文档或经验与读者分享。
目录
前言
第1章网络爬虫策略
1.1信息时代的飞跃
1.1.1搜索引擎的出现
1.1.2搜索之网络爬虫的由来
1.2网络爬虫
1.2.1网络爬虫的基础框架
1.2.2网络爬虫的策略分析
1.2.3暗网获取
1.2.4分布式爬虫
1.3实现Web搜索
1.3.1Web搜索的概念
1.3.2经典小实例展示
1.4疑难解析
1.4.1本节技术概念
1.4.2实例疑难解析
1.5实践心得
1.5.1如何快速实现Web搜索
1.5.2如何解决和发现代码错误
1.6本章小结
第2章搜索引擎技术中的Lucene
2.1Lucene到底是什么
2.1.1Lucene的由来
2.1.2Lucene的概念
2.1.3Lucene的适用范围
2.2Lucene的架构
2.2.1Lucene=“完整的搜索程序”吗
2.2.2搜索和索引组件介绍
2.2.3其他模块
2.2.4Lucene与应用的完美结合
2.3Lucene小程序
2.3.1创建索引
2.3.2搜索索引
2.4实践心得
2.4.1实现创建和搜索的技术解析
2.4.2实例创建过程中的个人心得
2.5本章小结
第3章创建索引实例
3.1开发前的软硬件准备
3.1.1开发语言和专业基础
3.1.2开发环境基础
3.2对文本文档进行索引
3.2.1新建文本文档
3.2.2基础的索引代码
3.2.3索引结果
3.3实例中用到的类和关键词
3.3.1实例中涉及的类
3.3.2实例中涉及的关键词
3.4本章技术要点和关键点
3.4.1本章技术要点
3.4.2本章关键点
3.4.3技术突破点
3.5开发中的个人心得分享
3.6本章小结
第4章初建索引
4.1建立数据库索引的前提和意义
4.1.1建立数据库索引的前提
4.1.2建立数据库索引的基本条件
4.1.3建立数据库索引的意义
4.2建立数据库索引实例
4.2.1新建索引类
4.2.2实例核心代码示例
4.3实例中重要的工具:Luke
4.3.1什么是Luke
4.3.2Luke的作用
4.4解决疑难问题的个人心得
4.4.1多样化实例的参考
4.4.2案例分析
4.5SQLServer2005、SQLServer2008以及Oracle数据库的区别
4.6本章小结
第5章分词技术详解
5.1分词的定义和意义
5.2英文分词介绍
5.3中文分词解析
5.3.1中文分词的目的
5.3.2中文分词的意义
5.3.3中文分词的方法
5.4宾例的分词方法剖析
5.4.1IKAnalyzer的诞生
5.4.2IKAnalyzer的配置方法
5.4.3IKAnalyzer的使用
5.5分词技术的广泛应用
5.5.1搜索引擎网站的分词技术应用
5.5.2分词技术深入各个领域
5.6实践见解
5.6.1关于分词的问题
5.6.2关于搜索引擎分词和查找的个人心得
5.7本章小结
第6章jar包应用详解
6.1jar包的定义
6.2基本的jar包介绍
6.2.1连接SQLServer的jar包
6.2.2Lucene常用的jar包
6.3实例中的分词jar包IKAnalyzer3.2.8
6.3.1概念
6.3.2适用范围和基本配置要求
6.3.3使用案例分析
6.4实例中的其他jar包应用
6.4.1实例包含的其他jar包
6.4.2适用范同和案例分析
6.5jar包的调用方法
6.6扩展:如何生成jar包和运行
jar包
6.7实践分享
6.7.1如何在自己的项目中灵活运用jar包
6.7.2jar的路径问题
6.7.3jar包中class文件的反编译
6.8本章小结
第7章构建应用程序的实现
7.1建立实例的项目
7.1.1src目录
7.1.2webroot目录
7.2详解扩展词典和停止词
7.2.1为什么需要扩展词典和停止词
7.2.2扩展词典的应用
7.2.3停止词应用
7.3应用程序测试
7.3.1应用程序在MyEclipse下的调试
7.3.2搜索结果的分页技术
7.3.3实现界面搜索
7.4开发过程中的疑难问题分享
7.4.1停止词的准确应用
7.4.2扩展词典问题
7.4.3界面分页显示的实例分析
7.4.4localhost与127.0.0.1的异同
7.4.5src目录和webroot目录
7.5本章小结
第8章查询方法的实现
8.1查询的概念和意义
8.1.1搜索引擎实现查询的概念
8.1.2搜索引擎查询的意义
8.2查询的分类
8.2.1完全匹配查询
8,2.2模糊查询
8.2.3多域查询
8.2.4通配符查询
8.2.5其他查询
8.2.6组合查询
8.3实例分析
8.3.1完全匹配查询实例解析
8.3.2模糊查询实例分析
8.3.3多域查询实例分析
8.3.4通配符查询实例分析
8.3.5其他查询实例及分析
8.3.6组合查询实例及分析
8.4实践过程中的重难点解析
8.4.1使用什么查询方法
8.4.2模糊查询案例剖析
8.4.3Occur.MUST与Occur.SHOULD
8.5本章小结
第9章高亮显示技术
9.1高亮显示的概念和目的
9.1.1高亮显示的概念
9.1.2高亮显示的目的
9.2高亮显示的模块介绍
9.2.1高亮显示的步骤
9.2.2高亮显示的重要模块
9.2.3其他相关内容
9.3高亮实现搜索结果
9.3.1高亮显示的实例
9.3.2高亮显示的搜索结果
9.3.3高亮显示界面效果
9.4高亮显示的应用
9.5高亮显示的技术疑难分析
9.5.1如何解决高亮查询结果显示不完全的问题
9.5.2高亮显示的对应问题解析
9.6本章小结
第10章结果排序和词频统计
10.1排序和词频统计概念
10.1.1什么是搜索结果排序
10.1.2搜索结果排序的意义
10.1.3什么是词频统计
10.1.4词频统计的意义何在
10.2排序分类
10.2.1根据域值排序
10.2.2索引顺序排序
10.2.3根据相关性排序
10.2.4根据词频率排序
10.2.5其他
10.3实例分析
10.3.1根据域值排序的实例解析
10.3.2根据索引顺序排序的实例分析
10.3.3根据相关性排序的实例分析
10.3.4根据词频排序实例分析
10.3.5其他排序方法实例分析
10.4实践心得
10.4.1查询结果排序的问题
10.4.2关于词性处理的问题解析
10.5本章小结
第11章开发中的性能优化概述
11.1代码的优化
11.1.1什么是代码优化
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网