您好,欢迎来到聚文网。 登录 免费注册
文本数据挖掘(第2版)

文本数据挖掘(第2版)

  • 字数: 522000
  • 装帧: 平装
  • 出版社: 清华大学出版社
  • 作者: 宗成庆,夏睿,张家俊
  • 出版日期: 2022-11-01
  • 商品条码: 9787302612957
  • 版次: 2
  • 开本: 16开
  • 页数: 352
  • 出版年份: 2022
定价:¥99 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
编辑推荐
"《文本数据挖掘(第2版)》通过实例说明实现相关任务的理论方法和技术思路,而不过多地涉及实现细节,尽量使读者能够在充分理解基本原理的基础上掌握应用系统的实现方法。 "
内容简介
   文本数据挖掘是通过机器学习、自然语言处理和推理等相关技术或方法,理解、分析和挖掘文本的内容,从而完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。《文本数据挖掘(第2版)》主要介绍与文本数据挖掘有关的基本概念、理论模型和实现算法,包括数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分析与观点挖掘、话题检测与跟踪、信息抽取以及文本自动摘要等,最后通过具体实例展示相关技术在实际应用中的使用方法。
《文本数据挖掘(第2版)》书可作为高等院校计算机、自动化、网络安全、大数据分析等专业,以及利用到文本信息处理的交叉学科(如金融财经、社会人文、生物医药等)的高年级本科生或研究生从事相关研究的入门参考书,也可供相关技术研发人员阅读和参考。
作者简介
宗成庆,中国科学院自动化所研究员、博士生导师,中国科学院大学岗位教授,ACL/CAAI/CCF Fellow,主要从事自然语言处理、机器翻译和语言认知计算等研究,主持国家项目10余项,发表论文200余篇,出版《统计自然语言处理》、《文本数据挖掘》和Text Data Mining三部专著及两部译著。担任国际计算语言学委员会(ICCL)委员,中国中文信息学会副理事长,曾任亚洲自然语言处理学会(AFNLP)主席,不错学术会议ACL’2015和COLING’2020程序委员会主席、ACL’2021大会主席。荣获国家科技进步奖二等奖和多个省部级及国家一级学会的科技奖励,获得北京市优秀教师、中科院优秀导师和国科大李佩教学名师等若干荣誉。享受国务院特殊津贴。张家俊,中国科学院自动化研究所研究员、中国科学院大学岗位教授、博士生导师,主要研究方向为机器翻译和自然语言处理,获得国家优秀青年科学基金资助,入选中国科协首届青年人才托举工程、中国科学院青年创新促进会优秀会员和北京智源青年科学家。发表CCF-A/B类论文80余篇,出版学术专著2部,译著1部。获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖一等奖和2020年北京市科学技术奖一等奖等。担任中国中文信息学会青年工作委员会主任和机器翻译专委会副主任。担任ACL/EMNLP/COLING的(资深)领域主席和《自动化学报》等期刊的编委。夏睿,南京理工大学计算机学院教授、博士生导师,研究领域为人工智能、自然语言处理、文本数据挖掘,在国内外重要期刊和会议发表论文60余篇,出版学术专著2部,主持国家和省部级项目近10项,获得国际计算语言学会年会ACL2019杰出论文奖、中国中文信息学会青年创新奖一等奖等荣誉,获得江苏省杰出青年基金资助。
目录
第1章绪论
1.1基本概念
1.2文本挖掘任务
1.3文本挖掘面临的困难
1.4方法概述与本书的内容组织
1.5进一步阅读
习题
第2章数据预处理和标注
2.1概述
2.2数据获取
2.3数据预处理
2.4数据标注
2.5基本工具
2.5.1汉语自动分词与词性标注
2.5.2句法分析
……

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网