新書推薦:
《
可控性混乱
》
售價:HK$
66.1
《
篡魏:司马懿和他的夺权同盟
》
售價:HK$
65.0
《
狂飙年代:18世纪俄国的新文化和旧文化(第三卷)
》
售價:HK$
177.0
《
协和专家大医说:医话肿瘤
》
售價:HK$
109.8
《
潜水指南 全彩图解第4版
》
售價:HK$
132.2
《
超大规模集成电路设计——从工具到实例
》
售價:HK$
88.5
《
村上春树·旅(一本充满村上元素的旅行指南,带你寻访电影《挪威的森林》拍摄地,全彩印刷;200余幅摄影作品)
》
售價:HK$
66.1
《
智能驾驶硬件在环仿真测试与实践
》
售價:HK$
155.7
|
編輯推薦: |
本书在多年科研积累的基础上,指导读者建立以理论 实践 前沿为导向的“计算机视觉”学习思路,后以基于YOLO和DeepSort的目标检测与跟踪的综合案例完成实践
|
內容簡介: |
人工智能正在成为全世界产业变革的方向,处于第四次科技革命的核心地位。计算机视觉(Computer Vision)就是利用摄像机、算法和计算资源为人工智能系统按上“眼睛”,让其可以拥有人类的双眼所具有的前景与背景分割、物体识别、目标跟踪、判别决策等功能。计算机视觉系统可以让计算机看见并理解这个世界的“信息”,从而替代人类完成重复性工作。目前计算机视觉领域热门的研究方向有物体检测和识别、语义分割、目标跟踪等。本书围绕着计算机视觉的关键技术,介绍基于深度学习计算机视觉的基础理论及主要算法。本书结合常见的应用场景和项目实例,循序渐进地带领读者进入美妙的计算机视觉世界。本书共分为11章,2~5章介绍计算机视觉的几种关键技术,即图像分类、目标检测、图像分割和目标跟踪,并将这四项关键技术组合完成人工智能的实际应用。本书在6、7章介绍人工智能的两个典型应用:文字检测与识别系统及多任务深度学习系统,第8章介绍一种非常有意思的深度学习网络——对抗生成神经网络,第9章介绍制作训练和测试样本的方法,第10章介绍如何安装TensorFlow、Keras API及相关介绍,第11章介绍综合实验。本书提供了大量项目实例及代码解析,均是基于Python语言及TensorFlow、Keras API的。本教材的每章均配有微课视频,扫描每章的二维码,可观看作者的视频讲解
|
關於作者: |
北京交通大学教授、博士生导师,曾任日本SECOM东京研究院研究员。从事人工智能、计算机视觉技术的教学与科研工作,在智能监控、无人系统视觉感知、车载视觉环境感知、基于视觉的表面缺陷检测、运输载体故障诊断等方向有着多年的科研经验。近年来主持国家自然科学基金、北京市科委重点研发专项等、省部级、企业合作项目,共计30余项。在国际重要的学术期刊与会议上发表论文60余篇,其中被SCI收录论文20余篇,被授权发明专利6项(日本发明专利3项)。致力于人工智能技术的产业化应用。曾自主研发多套软件与装备,如无人系统的视觉感知系统、无人机智能监测系统、智能巡检系统、煤矿运输皮带综合监测系统、高速铁路运行安全监测系统等,产生良好的经济和社会效益。
|
目錄:
|
第1章 人工智能概述 1
1.1 人工智能的发展浪潮 1
1.2 AI技术发展历史 4
1.2.1 AI技术三要素之算法 4
1.2.2 AI技术三要素之计算资源 6
1.2.3 AI三要素之数据 6
1.3 视频分析技术的应用案例 9
1.3.1 基于人脸识别技术的罪犯抓捕系统 9
1.3.2 基于文字识别技术的办公自动化系统 10
1.3.3 基于图像分割及目标检测技术的无人驾驶环境感知系统 10
1.3.4 基于目标检测及跟踪技术的电子交警系统 10
1.3.5 基于图像比对技术的产品缺陷检测系统 10
1.3.6 基于行为识别技术的安全生产管理系统 10
1.4 本章小结 10
第2章 深度卷积神经网络 11
2.1 深度卷积神经网络的概念 11
2.2 卷积神经网络的构成 12
2.2.1 卷积层 12
2.2.2 激活函数 12
2.2.3 池化层 14
2.3 深度卷积神经网络模型结构 14
2.3.1 常用网络模型 14
2.3.2 网络模型对比 20
2.4 图像分类 20
2.5 迁移学习 21
2.6 图像识别项目实例 22
2.6.1 下载ImageNet的训练模型 22
2.6.2 ResNet模型构建 23
2.6.3 测试图像 26
2.7 本章小结 27
2.8 习题 27
第3章 目标检测 28
3.1 目标检测的概念 28
3.2 基于候选区域的目标检测算法 29
3.2.1 Faster R-CNN目标检测算法 30
3.2.2 基于区域的全卷积网络(R-FCN)目标检测算法 30
3.3 基于回归的目标检测算法 32
3.3.1 YOLO目标检测算法 32
3.3.2 SSD目标检测算法 33
3.4 目标检测算法评价指标 34
3.5 深度卷积神经网络目标检测算法性能对比 35
3.6 目标检测项目实战 36
3.6.1 Faster R-CNN 36
3.6.2 用YOLO训练自己的模型 40
3.7 本章小结 43
3.8 习题 43
第4章 图像分割 44
4.1 图像分割的概念 44
4.2 典型的图像分割算法 45
4.2.1 FCN分割算法 45
4.2.2 DeepLab分割算法 45
4.2.3 SegNet图像分割算法 47
4.2.4 U-Net算法 47
4.2.5 Mask R-CNN算法 48
4.3 图像分割评价标准 49
4.4 图像分割项目实战 50
4.4.1 FCN32模型构建 51
4.4.2 FCN8的模型构建 52
4.4.3 Seg-Net的模型构建 53
4.4.4 U-Net的模型构建 56
4.5 本章小结 59
4.6 习题 59
第5章 目标跟踪 60
5.1 图像分割的概念 60
5.2 基于光流特征的目标跟踪算法 63
5.2.1 基于光流特征跟踪算法概述 63
5.2.2 LK光流法 65
5.3 SORT目标跟踪算法 66
5.3.1 卡尔曼滤波器 66
5.3.2 基于匈牙利算法的数据关联 68
5.4 Deep SORT多目标跟踪算法 69
5.4.1 Deep SORT算法跟踪原理 69
5.4.2 外观特征间的关联性计算 69
5.4.3 利用运动信息关联目标 71
5.4.4 级联匹配 71
5.5 目标跟踪算法评价指标 72
5.6 Deep SORT算法主要程序及分析 72
5.6.1 目标检测框的获取及坐标转换 72
5.6.2 卡尔曼滤波 73
5.6.3 深度外观特征的提取 77
5.6.4 匹配 78
5.6.5 后续处理 79
5.7 本章小结 81
5.8 习题 81
第6章 OCR文字识别 82
6.1 OCR文字识别的概念 82
6.2 文字检测 83
6.2.1 传统的文字检测算法 83
6.2.2 基于深度学习的文字检测算法 83
6.3 文字识别算法 89
6.3.1 基于DenseNet网络模型的序列特征提取 89
6.3.2 基于LSTM结构的上下文序列特征提取 91
6.3.3 字符序列的解码方式 92
6.4 项目实战 95
6.4.1 CRAFT模型搭建 96
6.4.2 CRNN模型搭建 97
6.4.3 文字检测与识别程序 99
6.5 本章小结 104
6.6 习题 105
第7章 多任务深度学习网络 106
7.1 多任务深度学习网络的概念 107
7.2 多任务深度学习网络构建 107
7.2.1 多任务网络的主要分类 107
7.2.2 并行式网络 109
7.2.3 级联式网络 110
7.3 多任务深度学习网络的代码实现 113
7.3.1 构建多任务深度学习网络 114
7.3.2 多任务深度学习网络的训练 116
7.3.3 多任务深度学习模型测试 116
7.4 本章小结 119
7.5 习题 119
第8章 生成对抗神经网络 120
8.1 生成对抗网络的概念 120
8.2 典型的生成对抗网络 121
8.2.1 DCGAN 121
8.2.2 CycleGAN 123
8.3 传送带表面缺陷样本增强案例 126
8.4 项目实战 128
8.4.1 DCGAN 128
8.4.2 CycleGAN 130
8.5 本章小结 132
8.6 习题 132
第9章 样本制作与数据增强 133
9.1 数据的获取 133
9.2 数据的标注 133
9.2.1 目标检测与识别标注软件LabelImg 134
9.2.2 图像分割标注软件LabelMe 134
9.3 数据增强 134
9.4 项目实战:数据增强 135
9.4.1 数据增强库的安装与卸载 135
9.4.2 数据增强库的基本使用 136
9.4.3 样本数据增强的结果 136
9.4.4 关键点变换 137
9.4.5 标注框(Bounding Box)变换 139
9.5 本章小结 141
9.6 习题 141
第10章 Keras安装和API 142
10.1 安装Keras 142
10.1.1 第1步——安装依赖项 142
10.1.2 第2步——安装TensorFlow 144
10.1.3 第3步——安装Keras 145
10.1.4 第4步——测试TensorFlow和Keras 145
10.2 配置Keras 146
10.3 Keras API 146
10.4 TensorFlow API 146
10.5 本章小结 147
第11章 综合实验:基于YOLO和Deep Sort的目标检测与跟踪 148
11.1 算法流程 148
11.2 实验代码 149
11.3 实验评价 155
|
內容試閱:
|
计算机视觉是人工智能领域的一个重要组成部分,它的主要任务是对采集的图片或视频进行处理以获得相应信息。传统的计算机视觉算法的主要步骤是提取包括边缘、角点、颜色等图像特征,然后利用这些图像特征完成图像处理与机器学习的任务。传统算法的主要问题在于需要告诉系统在图像中寻找哪些图像特性。由于提取图像特征部分是人为设计的,在实现的过程中,对于算法、功能及阈值的更改都需要手工完成,这对高质量的项目实现造成了很大的障碍,而深度学习的出现解决了这一问题。当前,深度学习在处理计算机视觉子任务方面取得了重大进展。深度学习的不同之处在于它不再通过精心设计的算法来搜索特定的图像特征,而是通过训练大量的神经网络参数来实现。本书将从计算机视觉的四大关键技术出发,详细介绍基于深度学习的计算机视觉技术的基础理论、主要算法项目实战及代码实现。本书结合常见的人工智能应用场景,循序渐进地带领读者进入美妙的计算机视觉世界。
第1章介绍人工智能概述,对人工智能的发展历程及常见的应用案例进行详细介绍;第2章讲解卷积神经网络的基本原理,几种常见的深度卷积神经网络框架,并介绍图像分类的项目实战;第3章主要讲解目标检测的基本原理,几种典型的目标检测算法,并介绍目标检测的项目实战;第4章讲解图像分割的基本原理,几种典型的图像分割算法,结合项目实战使读者进一步理解图像分割算法;第5章介绍目标跟踪的基本原理,几种典型的目标跟踪算法,并通过项目实战介绍目标跟踪算法的实现过程;第6章讲解文字检测与识别系统的基本构成及原理,几种典型的文字检测及识别算法,并通过项目实战进一步介绍文字检测与识别的实现过程;第7章讲解多任务深度学习网络的原理、构建方法和实用技巧,并通过项目实例给出了易于理解的项目实战方法;第8章讲解生成对抗神经网络的基本原理,介绍几种典型的生成对抗神经网络算法,并通过项目实例介绍生成对抗神经网络的构建过程;第9章主要讲解怎样制作训练样本,包括数据的标注及数据增强两部分;第10章介绍Keras和API的安装方法;第11章介绍综合实验。按照以上章节介绍的理论及案例,就可以逐步开启计算机视觉的项目实战了。
时光荏苒,岁月如梭,转眼研究计算机视觉与神经网络已经近二十个年头了,感谢引领我进入这个领域的恩师谷荻隆嗣教授,在教授那里学习到的研究方法和学术态度让我受益终身。在漫长岁月里,由于计算资源的限制和一些结构上的缺陷,神经网络一度备受冷落,由衷地敬佩和感慨Geoffrey Hinton教授在这一领域锲而不舍地坚持和奉献,让深度学习真正地进入了产业界,解决了我在漫长二十年的学术生涯中遇到的多个百思不得其解的难题。同样感谢我的学生们的支持和奉献。本书的部分章节参考了我指导的研究生黄伟杰、裴柳、李博、李雪倩、支勇、王贝贝的硕士论文及毕业设计成果。在撰写书稿的过程中,重新翻开同学们的毕业论文,在一起奋战的日日夜夜一幕幕地浮现在眼前。传承、融入、影响、身教、合作、困惑与顿悟汇成了我对计算机视觉的全部理解。
编 者
2021年7月
|
|