您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
文本挖掘与信息检索概论/大数据与人工智能技术丛书
字数: 277
出版社: 清华大学
作者: 编者:蔡晓妍//杨黎斌//程塨//姚西文//姚超等|责编:付弘宇//薛阳
商品条码: 9787302597445
版次: 1
开本: 16开
页数: 180
出版年份: 2022
印次: 1
定价:
¥49
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥22.05
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
文本挖掘与信息检索是 近年来人工智能领域的热点 研究方向。本书共分8章, 包括信息检索概述、信息检 索模型、信息检索的评价、 文本分类技术、文本聚类技 术、自动摘要技术、文本推 荐技术和网页链接分析,融 合了统计学、机器学习、数 据库等知识,具有多学科交 叉的特点。 本书内容全面,案例丰 富,适合作为人工智能、数 据科学、计算机、软件工程 等信息技术相关专业的本科 生和研究生教材,也可作为 企事业单位、政府部门和研 究机构的文本挖掘、信息检 索相关方向研究人员的参考 资料。
目录
第1章 信息检索概述 1.1 数据、信息和知识 1.1.1 从数据到信息 1.1.2 从信息到知识 1.2 信息检索的定义 1.3 信息检索的发展 1.3.1 信息检索的发展历史 1.3.2 信息检索的主要方法 1.3.3 信息检索的应用 1.3.4 信息检索的发展趋势 习题 第2章 信息检索模型 2.1 概述 2.2 向量空间检索模型 2.2.1 内积 2.2.2 相似度计算 2.3 概率检索模型 2.3.1 概率论基础知识 2.3.2 词项权重 2.3.3 二值独立模型 2.3.4 非二值独立模型 2.4 基于语言建模的信息检索模型 2.4.1 庞特模型 2.4.2 零概率问题以及解决方法 2.4.3 语言模型检索框架 2.4.4 跨语言检索模型 习题 第3章 信息检索的评价 3.1 信息检索的评价指标 3.1.1 查全率 3.1.2 査准率 3.1.3 查准率与查全率的关系 3.1.4 漏检率和误检率 3.1.5 响应时间 3.2 信息检索系统的评价 习题 第4章 文本分类技术 4.1 概述 4.1.1 基本概念 4.1.2 文本自动分类的两种类型 4.1.3 文本分类模式 4.1.4 文本分类过程 4.2 文本预处理 4.2.1 分词技术 4.2.2 停用词去除 4.2.3 文本特征选择方法 4.2.4 文本表示方法 4.3 相似度度量方法 4.4 常用分类算法分析 4.4.1 Rocchio算法 4.4.2 贝叶斯分类器 4.4.3 贝叶斯信念网络 4.4.4 K近邻算法 4.4.5 支持向量机 4.5 分类性能评价 4.5.1 精确度和召回率 4.5.2 F-测量 4.5.3 分类方法的综合评价 4.6 基于向量空间模型的文本分类方法 4.6.1 文本分类系统的结构框架 4.6.2 改进的文本特征抽取算法 4.6.3 二级分类模式 4.7 基于语言模型的文本分类 4.7.1 概述 4.7.2 Bigram模型 4.7.3 特征提取 4.7.4 分类器设计 4.7.5 统计平滑 4.8 基于卷积神经网络的文本分类 4.8.1 CNN概述 4.8.2 CNN文本分类经典结构 4.8.3 CNN文本分类方法 习题 第5章 文本聚类技术 5.1 概述 5.2 常用的聚类方法 5.2.1 基于划分的聚类方法 5.2.2 基于分层的聚类方法 5.2.3 基于密度的聚类方法 5.2.4 基于网格的聚类方法 5.2.5 基于模型的聚类方法 5.3 聚类算法的评价标准 5.4 基于K-means的文本聚类算法 5.4.1 概述 5.4.2 K-means算法理论基础 5.4.3 K-means算法结果影响因素 5.4.4 TF-IDF理论基础 5.4.5 基于K-means文本聚类的主要步骤 5.4.6 基于K-means算法的聚类实例 5.5 基于潜在语义索引的文本聚类方法 5.5.1 概述 5.5.2 矩阵的奇异值分解 5.5.3 LSI技术的理论基础 5.5.4 基于LSI文本聚类的主要步骤 5.5.5 基于LSI文本聚类的实例 5.6 基于Word2Vec的文本聚类方法 5.6.1 词向量概述 5.6.2 Word2Vec语言模型 5.6.3 连续词袋模型 5.6.4 Skip-gram模型 5.6.5 基于Word2Vec的文本聚类举例 习题 第6章 自动摘要技术 6.1 概述 6.2 抽取式摘要 6.2.1 基于TextRank的文本自动摘要 6.2.2 基于图模型的文本自动摘要 6.2.3 融合噪声检测的多文档自动摘要 6.2.4 抽取式多文档自动摘要 6.3 生成式摘要 6.3.1 融合词汇特征的生成式摘要模型 6.3.2 基于深度学习的文本自动摘要 6.3.3 基于HITS注意力神经网络的生成式摘要模型 6.4 自动摘要的评价方法 6.4.1 内部评价法 6.4.2 外部评价法 习题 第7章 文本推荐技术 7.1 基于内容的推荐方法 7.1.1 概述 7.1.2 存在的问题 7.2 基于协同过滤的推荐方法 7.2.1 基于用户的协同过滤推荐方法 7.2.2 基于物品的协同过滤推荐方法 7.2.3 存在的问题 7.3 混合推荐方法 7.4 基于图表示学习的推荐方法 7.4.1 图表示学习方法 7.4.2 基于图表示学习的推荐 7.4.3 基于DeepWalk异构文献网络表示学习的个性化全局引文推荐方法 7.5 推荐系统的评价 7.5.1 评价指标 7.5.2 基于DeepWalk异构文献网络表示学习的个性化全局引文推荐方法的实验结果分析 习题 第8章 网页链接分析 8.1 超链和页面内容的关系 8.2 特征提取和特征表示 8.3 不同搜索阶段的分析 8.4 PageRank算法 8.4.1 PageRank算法定义 8.4.2 PageRank算法的优点和缺点 8.4.3 基于LexRank的多文档自动摘要方法 8.5 HITS算法 8.5.1 HITS算法定义 8.5.2 寻找其他的特征向量 8.5.3 寻找同引分析和文献耦合的关系 8.5.4 HITS算法的优点和缺点 8.5.5 基于HITS的多文档自动摘要 8.6
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网