您好,欢迎来到聚文网。
登录
免费注册
网站首页
|
搜索
热搜:
磁力片
|
漫画
|
购物车
0
我的订单
商品分类
首页
幼儿
文学
社科
教辅
生活
销量榜
深度实践OCR 基于深度学习的文字识别
装帧: 平装
出版社: 机械工业出版社
作者: 刘树春 等
出版日期: 2020-05-01
商品条码: 9787111654049
版次: 1
开本: 16开
页数: 312
出版年份: 2020
定价:
¥89
销售价:
登录后查看价格
¥{{selectedSku?.salePrice}}
库存:
{{selectedSku?.stock}}
库存充足
{{item.title}}:
{{its.name}}
加入购物车
立即购买
加入书单
收藏
精选
¥5.83
世界图书名著昆虫记绿野仙踪木偶奇遇记儿童书籍彩图注音版
¥5.39
正版世界名著文学小说名家名译中学生课外阅读书籍图书批发 70册
¥8.58
简笔画10000例加厚版2-6岁幼儿童涂色本涂鸦本绘画本填色书正版
¥5.83
世界文学名著全49册中小学生青少年课外书籍文学小说批发正版
¥4.95
全优冲刺100分测试卷一二三四五六年级上下册语文数学英语模拟卷
¥8.69
父与子彩图注音完整版小学生图书批发儿童课外阅读书籍正版1册
¥24.2
好玩的洞洞拉拉书0-3岁宝宝早教益智游戏书机关立体翻翻书4册
¥7.15
幼儿认字识字大王3000字幼儿园中班大班学前班宝宝早教启蒙书
¥11.55
用思维导图读懂儿童心理学培养情绪管理与性格培养故事指导书
¥19.8
少年读漫画鬼谷子全6册在漫画中学国学小学生课外阅读书籍正版
¥64
科学真好玩
¥12.7
一年级下4册·读读童谣和儿歌
¥38.4
原生态新生代(传统木版年画的当代传承国际研讨会论文集)
¥11.14
法国经典中篇小说
¥11.32
上海的狐步舞--穆时英(中国现代文学馆馆藏初版本经典)
¥21.56
猫的摇篮(精)
¥30.72
幼儿园特色课程实施方案/幼儿园生命成长启蒙教育课程丛书
¥24.94
旧时风物(精)
¥12.04
三希堂三帖/墨林珍赏
¥6.88
寒山子庞居士诗帖/墨林珍赏
¥6.88
苕溪帖/墨林珍赏
¥6.88
楷书王维诗卷/墨林珍赏
¥9.46
兰亭序/墨林珍赏
¥7.74
祭侄文稿/墨林珍赏
¥7.74
蜀素帖/墨林珍赏
¥12.04
真草千字文/墨林珍赏
¥114.4
进宴仪轨(精)/中国古代舞乐域外图书
¥24.94
舞蹈音乐的基础理论与应用
内容简介
这是一部融合了企业界优选工程实践经验和学术界前沿技术和思想的OCR著作。本书由阿里巴巴本地生活研究院算法团队技术专家领衔,从组件、算法、实现、工程应用等维度系统讲解基于深度学习的OCR技术的原理和落地。书中一步步剖析了算法背后的数学原理,提供大量简洁的代码实现,帮助读者从零基础开始构建OCR算法。全书共10章:第1章从宏观角度介绍了OCR技术的发展历程、概念和产业应用;第2章讲解了OCR的图像预处理方法;第3~4章介绍了传统机器学习方法和深度学习的相关基础知识;第5章讲解了基于传统方法和深度学习方法的OCR数据生成;第6章讲解了与OCR相关的一些高级深度学习方法,方便读者理解后续的检测和识别部分;第7章讲解了文字的检测技术,从通用的目标检测到文字检测,一步步加深读者对文字检测的认识;第8章讨论了文字识别的相关技术,定位到文字的位置之后,需要对文字的内容进行进一步的解析;第9章介绍了一些OCR后处理的方法;第10章介绍了一些版面分析方法。
目录
推荐序
前言
第1章 绪论
1.1 人工智能大潮中的OCR发展史
1.1.1 传统OCR方法一般流程
1.1.2 基于深度学习OCR方法一般流程
1.2 文字检测
1.3 文字识别
1.4 产业应用现状
1.5 本章小结
1.6 参考文献
第2章 图像预处理
2.1 二值化
2.1.1 全局阈值方法
2.1.2 局部阈值方法
2.1.3 基于深度学习的方法
2.1.4 其他方法
2.2 平滑去噪
2.2.1 空间滤波
2.2.2 小波阈值去噪
2.2.3 非局部方法
2.2.4 基于神经网络的方法
2.3 倾斜角检测和校正
2.3.1 霍夫变换
2.3.2 Radon变换
2.3.3 基于PCA的方法
2.4 实战
2.5 参考文献
第3章 传统机器学习方法绪论
3.1 特征提取方法
3.1.1 基于结构形态的特征提取
3.1.2 基于几何分布的特征提取
3.2 分类方法模型
3.2.1 支持向量机
3.2.2 K近邻算法
3.2.3 多层感知器
3.3 实战:身份证号码的识别
3.3.1 核心代码
3.3.2 测试结果
3.4 本章小结
3.5 参考文献
第4章 深度学习基础知识
4.1 单层神经网络
4.1.1 神经元
4.1.2 感知机
4.2 双层神经网络
4.2.1 双层神经网络简介
4.2.2 常用的激活函数
4.2.3 反向传播算法
4.3 深度学习
4.3.1 卷积神经网络
4.3.2 常用优化算法
4.4 训练网络技巧
4.4.1 权值初始化
4.4.2 L1/L2正则化
4.4.3 Dropout
4.5 实战
4.6 参考文献
第5章 数据生成
5.1 背景介绍
5.2 传统单字OCR数据生成
5.3 基于深度学习的OCR数据生成
5.3.1 文字检测数据的生成
5.3.2 检测图片生成
5.3.3 其他方法
5.3.4 识别数据生成
5.4 通过GAN的技术生成数据
5.4.1 GAN背景介绍
5.4.2 GAN的原理
5.4.3 GAN的变种
5.5 图像增广
5.5.1 常用的图像增强方法
5.5.2 深度学习方法
5.6 常用的开源数据集
5.7 ICDAR的任务和数据集
5.8 本章小结
5.9 参考文献
第6章 深度学习高级方法
6.1 图像分类模型
6.1.1 LeNet
6.1.2 AlexNet
6.1.3 VGGNet
6.1.4 GoogLeNet
6.1.5 ResNet
6.1.6 DenseNet
6.1.7 SENet
6.1.8 轻量化网络
6.2 循环神经网络
6.2.1 RNN网络
6.2.2 GRU
6.2.3 GRU的实现
6.2.4 LSTM网络
6.3 Seq2Seq
6.4 CTCLoss
6.4.1 算法详解
6.4.2 前向传播
6.4.3 后向传播
6.4.4 前向/后向算法
6.4.5 CTC算法特性
6.4.6 代码解析
6.5 Attention
6.6 本章小结
6.7 参考文献
第7章 文字检测
7.1 研究意义
7.2 目标检测方法
7.2.1 目标检测相关术语
7.2.2 传统检测方法
7.2.3 Two-stage方法
7.2.4 One-stage方法
7.3 文本检测方法
7.3.1 传统文本检测方法
7.3.2 基于深度学习的文本检测方法
7.4 本章小结
7.5 参考文献
第8章 字符识别
8.1 任务概览
8.2 数据集说明
8.2.1 数据集意义
8.2.2 常见识别数据集介绍
8.3 评测指标
8.3.1 编辑距离
8.3.2 归一化编辑距离
8.3.3 字符准确度
8.3.4 词准确率
8.3.5 语境相关的评测方式
8.4 主流算法介绍
8.4.1 传统光学方法
8.4.2 接近基于深度学习的方法
8.5 CRNN模型实战
8.5.1 简介
8.5.2 运行环境
8.5.3 测试部分讲解
8.5.4 测试运行结果
8.5.5 训练部分
8.5.6 用ICDAR2013数据集训练CRNN模型
8.6 本章小结
8.7 参考文献
第9章 OCR后处理方法
9.1 文本纠错
9.1.1 BK-tree
9.1.2 基于语言模型的中文纠错
9.2 文本结构化
9.2.1 模板匹配
9.2.2 文本分类
9.3 本章小结
9.4 参考文献
第10章 版面分析
10.1 版面分析详解
10.2 复杂版面识别
10.3 文档恢复
10.4 本章小结
10.5 参考文献
×
Close
添加到书单
加载中...
点此新建书单
×
Close
新建书单
标题:
简介:
蜀ICP备2024047804号
Copyright 版权所有 © jvwen.com 聚文网