您好,欢迎来到聚文网。 登录 免费注册
计算机视觉之深度学习 使用TensorFlow和Keras训练高级神经网络

计算机视觉之深度学习 使用TensorFlow和Keras训练高级神经网络

  • 字数: 319000
  • 装帧: 平装
  • 出版社: 人民邮电出版社
  • 作者: (英)拉贾林加帕·尚穆加马尼(Rajalingappaa Shanmugamani)
  • 出版日期: 2020-01-01
  • 商品条码: 9787115531582
  • 版次: 1
  • 开本: 16开
  • 页数: 201
  • 出版年份: 2020
定价:¥59 销售价:登录后查看价格  ¥{{selectedSku?.salePrice}} 
库存: {{selectedSku?.stock}} 库存充足
{{item.title}}:
{{its.name}}
精选
内容简介
本书开门见山,直接帮助你准备好训练高效深度学习模型的环境,以完成各种计算机视觉任务。书中介绍了常见的深度学习架构,如卷积神经网络和递归神经网络;讲述了如何利用深度学习进行图像分类、图像检索、目标检测、语义分割等内容。读完本书,你将能够开发和训练自己的深度学习模型,并用它们解决计算机视觉难题。
作者简介
拉贾林加帕·尚穆加马尼(Rajalingappaa Shanmugamani),目前在Kairos担任技术经理。在此之前,曾在新加坡SAP公司担任深度学习主管,也在创业公司从事过计算机视觉产品的开发和咨询工作。在同行评审的期刊和会议上多次发表文章,并在机器学习领域申请了专利。与他人合著出版了Hands-On Natural Language Processing with Python、Python Reinforcement Learning、Python:Advanced Guide to Artificial Intelligence、TensorFlow Deep Learning Projects等书。
白勇,海南大学信息科学技术学院教授、博士生导师、美国归国博士。长期从事物联网、人工智能方面的研究。已承担重量和省部级项目10多项,发表学术论文100多篇,授权中国和美国发明专利10多项。
目录
第1章入门1
1.1理解深度学习1
1.1.1感知机1
1.1.2激活函数2
1.1.3人工神经网络4
1.1.4训练神经网络7
1.1.5尝试TensorFlow游乐场8
1.1.6卷积神经网络8
1.1.7循环神经网络10
1.1.8长短期记忆网络11
1.2计算机视觉深度学习12
1.2.1分类12
1.2.2检测或定位与分割12
1.2.3相似性学习13
1.2.4图像题注13
1.2.5生成模型14
1.2.6视频分析15
1.3建立开发环境15
1.3.1硬件和操作系统15
1.3.2安装软件包17
1.4小结23
第2章图像分类24
2.1在TensorFlow中训练MNIST模型24
2.1.1MNIST数据集24
2.1.2加载MNIST数据25
2.1.3建立一个感知机25
2.1.4构建多层卷积网络28
2.2在Keras中训练MNIST模型35
2.2.1准备数据集35
2.2.2构建模型36
2.3其他流行的图像测试数据集38
2.3.1CIFAR数据集38
2.3.2Fashion-MNIST数据集38
2.3.3ImageNet数据集和竞赛39
2.4更大的深度学习模型40
2.4.1AlexNet模型40
2.4.2VGG-16模型41
2.4.3谷歌Inception-V3模型42
2.4.4微软ResNet-50模型45
2.4.5SqueezeNet模型45
2.4.6空间变换网络模型46
2.4.7DenseNet模型47
2.5训练猫与狗的模型47
2.5.1准备数据48
2.5.2使用简单CNN进行基准测试48
2.5.3增强数据集49
2.5.4迁移学习或微调模型50
2.5.5在深度学习中微调一些层51
2.6开发现实世界的应用53
2.6.1选择正确的模型53
2.6.2处理欠拟合和过拟合场景53
2.6.3从面部检测性别和年龄54
2.6.4微调服装模型54
2.6.5品牌安全54
2.7小结54
第3章图像检索55
3.1理解视觉特征55
3.1.1深度学习模型的可视化激活56
3.1.2嵌入可视化57
3.1.3DeepDream60
3.1.4对抗样本64
3.2模型推断65
3.2.1导出模型65
3.2.2提供训练好的模型66
3.3基于内容的图像检索68
3.3.1构建检索流水线68
3.3.2有效的检索71
3.3.3使用自编码器去噪74
3.4小结77
第4章目标检测78
4.1检测图像中的目标78
4.2探索数据集79
4.2.1ImageNet数据集79
4.2.2PASCALVOC挑战79
4.2.3COCO目标检测挑战79
4.2.4使用指标评估数据集80
4.3目标定位算法81
4.3.1使用滑动窗口定位目标82
4.3.2将定位看作回归问题83
4.4检测目标86
4.4.1R-CNN(区域卷积神经网络)86
4.4.2FastR-CNN86
4.4.3FasterR-CNN87
4.4.4SSD(单射多框探测器)88
4.5目标检测API88
4.5.1安装和设置88
4.5.2预训练模型89
4.5.3重新训练目标检测模型90
4.5.4为自动驾驶汽车训练行人检测92
4.6YOLO目标检测算法92
4.7小结94
第5章语义分割95
5.1预测像素95
5.1.1诊断医学图像97
5.1.2通过卫星图像了解地球97
5.1.3提供机器人视觉98
5.2数据集98
5.3语义分割算法98
5.3.1全卷积网络98
5.3.2SegNet架构99
5.3.3膨胀卷积103
5.3.4DeepLab104
5.3.5RefiNet105
5.3.6PSPnet106
5.3.7大卷积核的重要性106
5.3.8DeepLabv3107
5.4超神经分割107
5.5分割卫星图像111
5.6分割实例113
5.7小结114
第6章相似性学习115
6.1相似性学习算法115
6.1.1孪生网络115
6.1.2FaceNet模型118
6.1.3DeepNet模型120
6.1.4DeepRank模型120
6.1.5视觉推荐系统121
6.2人脸分析122
6.2.1人脸检测122
6.2.2人脸特征点和属性123
6.2.3人脸识别126
6.2.4人脸聚类130
6.3小结131
第7章图像题注132
7.1了解问题和数据集132
7.2理解图像题注的自然语言处理132
7.2.1用向量形式表达词133
7.2.2将词转换为向量133
7.2.3训练一个嵌入134
7.3图像题注和相关问题的方法135
7.3.1使用条件随机场来链接图像和文本136
7.3.2在CNN特征上使用RNN生成题注136
7.3.3使用图像排序创建题注138
7.3.4从图像检索题注与从题注检索图像139
7.3.5密集题注140
7.3.6使用RNN生成题注141
7.3.7使用多模态度量空间142
7.3.8使用注意网络生成题注143
7.3.9知道什么时候查看143
7.4实现基于注意力的图像题注145
7.5小结147
第8章生成模型148
8.1生成模型的应用148
8.1.1艺术风格迁移148
8.1.2预测视频中的下一帧149
8.1.3图像的超分辨率150
8.1.4交互式图像生成151
8.1.5图像到图像的翻译151
8.1.6文本到图像的生成152
8.1.7图像修复153
8.1.8图像混合153
8.1.9转换属性154
8.1.10创建训练数据154
8.1.11创建新的动画角色155
8.1.12照片3D模型155
8.2神经艺术风格迁移156
8.2.1内容损失156
8.2.2使用Gram矩阵的风格损失160
8.2.3风格迁移162
8.3生成对抗网络165
8.3.1vanillaGAN165
8.3.2条件GAN167
8.3.3对抗损失167
8.3.4图像翻译168
8.3.5InfoGAN168
8.3.6GAN的缺点169
8.4视觉对话模型169
8.5小结171
第9章视频分类172
9.1了解视频和视频分类172
9.1.1探索视频分类数据集172
9.1.2将视频分割成帧175
9.1.3视频分类方法175
9.2将基于图像的方法扩展到视频184
9.2.1人体姿态回归184
9.2.2视频分割185
9.2.3视频题注186
9.2.4视频生成188
9.3小结188
第10章部署189
10.1模型的性能189
10.1.1量化模型189
10.1.2MobileNets190
10.2云部署193
10.2.1AWS193
10.2.2Google云平台197
10.3在设备中部署模型200
10.3.1JetsonTX2200
10.3.2Android201
10.3.3iPhone201
10.4小结202

蜀ICP备2024047804号

Copyright 版权所有 © jvwen.com 聚文网