您好,欢迎来到聚文网。 登录 免费注册
基于机器学习的文本挖掘/西安交通大学元济译丛

基于机器学习的文本挖掘/西安交通大学元济译丛

  • 字数: 381
  • 出版社: 西安交大
  • 作者: (捷克)扬·茨卡//弗朗齐歇克·达雷纳//阿尔诺斯特·斯沃博达|译者:汪顺玉//戴钰涵
  • 商品条码: 9787569329889
  • 版次: 1
  • 开本: 16开
  • 页数: 330
  • 出版年份: 2023
  • 印次: 1
定价:¥105 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
《基于机器学习的文本 挖掘》以R语言作为分析工 具,通过详细案例介绍了文 本挖掘的一般流程及如何使 用贝叶斯分类器、最近邻、 支持向量机、决策树等机器 学习算法处理特征选择、分 类、聚类文本挖掘领域经典 任务。书籍第一章对机器学 习与文本挖掘技术做了综述 ;第二章系统介绍了用于文 本挖掘的主流编程语言R; 第三章介绍了文本结构化表 示方式;第四至十一章介绍 了文本挖掘中的分类问题及 如何实现机器学习算法解决 分类问题;第十二章介绍了 文本聚类及实践方式;第十 三至十四章介绍了当前主流 词嵌入方法及特征选择方法 。 本书结合实际语料案例 向读者介绍并实现当前机器 学习的主流分类算法、聚类 算法、词嵌入特征选择等技 术,为人文社科领域学者理 解和深入学习文本挖掘提供 了明晰的解释和系统的实施 路径。如果读者希望了解与 文本挖掘相关的各类机器学 习算法及如何用R包进行实 践,相信该书能够提供明晰 的解释和便捷的方案。
目录
第1章 基于机器学习的文本挖掘介绍 1.1 简介 1.2 文本挖掘和数据挖掘的关系 1.3 文本挖掘过程 1.4 用于文本挖掘的机器学习 1.5 机器学习的三种基本方向 1.6 大数据 1.7 关于本书 第2章 R语言介绍 2.1 R的安装 2.2 R的运行 2.3 RStudio 2.4 编写和执行命令 2.5 变量和数据类型 2.6 R中的对象 2.7 函数 2.8 运算符 2.9 向量 2.10 矩阵与数组 2.11 列表 2.12 因子 2.13 数据帧 2.14 机器学习常用函数 2.15 流控制结构 2.16 包 2.17 图表 第3章 文本结构化表示 3.1 简介 3.2 词袋模型 3.3 词袋模型的限制 3.4 文档特征 3.5 标准化 3.6 文本编码 3.7 语种识别 3.8 分词 3.9 句子检测 3.10 停用词、常用和特殊术语的过滤 3.11 变音符号的消除 3.12 归一化 3.13 标注 3.14 词袋模型的权重计算 3.15 存储结构化数据的常用格式 3.16 一个复杂示例 第4章 分类 4.1 样本数据 4.2 分类算法 4.3 分类器效率评估 第5章 贝叶斯分类器 5.1 简介 5.2 贝叶斯定理

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网