您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
联系客服
|
搜索
热搜:
漫画
|
三年级必读书
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
信息检索与搜索引擎(计算机科学与技术微课版面向新工科专业建设计算机系列教材)
字数: 283
出版社: 清华大学
作者: 编者:闫琰|总主编:张尧学
商品条码: 9787302660989
版次: 1
开本: 16开
页数: 165
出版年份: 2024
印次: 1
定价:
¥49
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
收藏
上架到店铺
×
Close
上架到店铺
{{shop.name}}
点此去绑定店铺
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥22.05
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
为了让读者全面了解信 息检索和搜索引擎的基本概 念、原理和实现方法,以及 相关的研究和应用领域,本 书详细阐述了信息检索中的 重要问题。 全书共分为3篇,涵盖信 息检索和搜索引擎的各个方 面:第1篇(第1~3章)为 基础篇,介绍信息检索和搜 索引擎的基本概念、原理以 及信息采集、文本转换方法 ;第2篇(第4~6章)为技 术篇,涵盖索引创建、用户 交互、检索模型与搜索排序 等关键技术;第3篇(第7章 和第8章)为应用篇,讨论 搜索引擎评价和链接分析, 展示搜索引擎在不同领域的 应用和发展趋势。全书提供 了大量应用实例,每章后均 附有习题。 通过对这些方面的讲解 ,读者可以了解信息检索和 搜索引擎的相关技术和方法 ,掌握它们的实现和应用, 为信息处理提供更好的解决 方案。
目录
第1章 信息检索和搜索引擎 1.1 什么是信息检索 1.1.1 Web搜索 1.1.2 其他搜索应用 1.1.3 其他信息检索应用 1.2 搜索引警架构 1.2.1 搜索引擎 1.2.2 基本的构件 1.3 搜索引擎构件及其功能 1.3.1 文本采集 1.3.2 文本转换 1.3.3 索引创建 1.3.4 用户交互 1.3.5 排序 1.3.6 评价 1.4 开源的搜索引擎系统 1.4.1 Lucene 1.4.2 Solr 1.4.3 ElasticSearch 1.5 搜索引擎面对的挑战 小结 习题 第2章 信息采集 2.1 网页 2.1 ,1网页的特点 2.1.2 网页规模的估计 2.1.3 网页的年龄 2.2 网页爬虫 2.2.1 网页爬虫的定义 2.2.2 网页爬虫的执行流程 2.2.3 设计网页爬虫的原则 2.2.4 网页爬虫的评价指标 2.2.5 爬取策略 2.2.6 深网爬取 2.3 网站地图 2.4 非网页类信息采集 2.5 存储文档 2.5.1 形成摘要 2.5.2 存储摘要 2.5.3 文档更新 2.5.4 网页去重和去噪 小结 习题 第3章 文本转换 3.1 文本的统计特征 3.1.1 词频分布 3.1.2 关联网页规模估计 3.2 停用词去除 3.3 词干提取 3.3.1 基于规则的词干提取 3.3.2 基于词典的词干提取 3.3.3 对比词干提取和词形还原 3.4 词素切分 3.4.1 基于字符串匹配的词素切分方法 3.4.2 基于统计的词素切分方法 3.4.3 英文词素切分(N元串) 3.5 文本转换的困难 3.6 文本的向量化表示 3.6.1 离散表示 3.6.2 分布式表示 小结 习题 第4章 索引创建 4.1 索引相关定义 4.1.1 单词-文档矩阵 4.1.2 单词词典 4.1.3 倒排索引相关概念 4.1.4 倒排索引简单实例 4.2 索引的建立 4.2.1 两遍文档遍历法 4.2.2 排序法 4.2.3 归并法 4.3 索引更新 4.3.1 动态索引 4.3.2 倒排索引的插入 4.3.3 倒排索引的删除 4.4 查询处理方法 4.4.1 Document-at-a-time 4.4.2 Term-at-a-time 4.4.3 查询优化 小结 习题 第5章 用户交互 5.1 信息需求与查询 5.2 查询转换与提炼 5.2.1 停用词去除和词干提取 5.2.2 拼写检查 5.3 查询扩展 5.3.1 基于全局分析的查询扩展 5.3.2 基于相关反馈和伪相关反馈的查询扩展 5.3.3 基于查询日志的查询扩展 5.4 上下文和个性化 5.5 查询推荐 5.5.1 基于文档的方法 5.5.2 基于查询日志的方法 5.6 搜索结果显示 小结 习题 第6章 检索模型与搜索排序 6.1 检索模型概述 6.1.1 布尔模型 6.1.2 向量空间模型 6.1.3 BOW模型 6.1.4 Latent Dirichlet Allocation 6.1.5 隐性语义分析 6.2 概率模型 6.2.1 概率检索模型 6.2.2 二元独立模型 6.2.3 BM25模型 6.3 语言模型 6.3.1 One-Hot和Word2Vec 6.3.2 -CBOW模型 6.3.3 Skip-gram模型 6.4 排序模型 6.4.1 K-L散度 6.4.2 Learning to Rank算法 6.5 基于机器学习的排序方法 小结 习题 第7章 搜索引擎评价 7.1 搜索引擎评价的意义 7.2 搜索引擎评价体系 7.3 效果评价 7.3.1 召回率、精确率、ROC曲线 7.3.2 平均精确率 7.3.3 关注排序靠前的文档 7.3.4 使用用户偏好 7.4 效率评价 7.5 训练、测试和统计 7.5.1 比较评价 7.5.2 显著性检验 7.5.3 最小化判定工作 7.5.4 设置参数值 小结 习题 第8章 链接分析 8.1 PageRank算法 8.1.1 什么是PageRank 8.1.2 PageRank的工作原理 8.1.3 PageRank计算 8.1.4 PageRank应用与分析 8.2 HITS算法 8.2.1 什么是HITS 8.2.2 HITS工作原理 8.2.3 HITS算法存在的问题 8.2.4 HITS与PageRank比较 8.2.5 其他改进算法 8.3 网页作弊技术 8.3.1 基于内容的作弊技术 8.3.2 基于链接关系的作弊技术 8.3.3 掩盖技术和重定向技术 8.4 网页反作弊技术 8.4.1 特定类别的作弊页面识别技术 8.4.2 非特定类别的作弊页面识别技术 小结 习题 参考文献
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网