基于深度学习的图像处理与实践

编号:: wx1203320028

销售价:: ￥87.12; (市场价: ~~￥99.00~~)

赠送积分:: 87

数量:: 件

商品介绍
商品参数
商品评论
商品咨询

商品介绍

"图像处理作为人工智能领域的重要分支，正在给我们的世界带来翻天覆地的变化。而在深度学习的引领下，图像处理技术正迎来全面升级!
《基于深度学习的图像处理与实践》将带您进入图像视觉技术的精彩世界，从基本概念一直深入到高级应用，涵盖了图像处理、图像增强、目标检测、人脸识别等多个方面。无论是初学者，还是有一定基础的读者，都可以通过本书逐步掌握图像处理与分析的核心技术。让您不仅能够掌握基本原理，更能够运用于实际项目中。
《基于深度学习的图像处理与实践》还为读者提供了丰富的学习资源，主要有视频讲解、PPT课件，以及书中案例源代码，可通过扫描书中二维码获取。"

《基于深度学习的图像处理与实践》循序渐进、深入浅出地讲解了基于深度学习的图像处理的核心知识，并通过具体实例演示了开发深度学习图像处理程序的方法和流程。全书共14章，分别讲解了图像识别技术基础，scikit-image数字图像处理，OpenCV图像视觉处理，dlib机器学习和图像处理，face_recognition人脸识别，采样、变换和卷积处理，图像增强，图像特征提取，图像分割，目标检测，图像分类，国内常用的第三方人脸识别平台，斗转星移换图系统，智能OCR文本检测识别系统等内容。本书语言简洁而不失技术深度，内容全面。

《基于深度学习的图像处理与实践》适用于已经了解了Python语言基础语法，想进一步学习机器学习、深度学习、计算机视觉与图像处理技术的读者，还可以作为大专院校相关专业的师生用书和培训机构的专业性教材。

王卓，华中科技大学计算机硕士。从事深度学习相关工作，擅长前沿人工智能算法的原理分析和应用落地，擅长计算机视觉、自然语言处理等方向的技术, 先后参与并负责了多个深度学习算法在不同场景的业务落地。目前主要负责电商场景下预训练语言模型的研发以及舆情风险的智能识别与治理。

第1章图像识别技术基础 1

1.1 图像识别概述 2

1.1.1 什么是图像识别 2

1.1.2 图像识别的发展阶段 2

1.1.3 图像识别的应用 3

1.2 图像识别的过程 4

1.3 图像识别技术 4

1.3.1 人工智能 5

1.3.2 机器学习 5

1.3.3 深度学习 6

1.3.4 基于神经网络的图像识别 6

1.3.5 基于非线性降维的图像识别 7

第2章 scikit-image数字图像处理 9

2.1 scikit-image基础 10

2.1.1 安装scikit-image 10

2.1.2 scikit-image中的模块 10

2.2 显示图像 11

2.2.1 使用skimage读入并显示外部图像 11

2.2.2 读取并显示外部灰度图像 12

2.2.3 读取并显示内置星空图片 13

2.2.4 读取并保存内置星空图片 14

2.3 常见的图像操作 14

2.3.1 对内置图片进行二值化操作 15

2.3.2 对内置图片进行裁剪处理 16

2.3.3 将RGB图转换为灰度图 17

2.3.4 使用skimage实现绘制图片功能 18

2.3.5 使用subplot()函数绘制多视图窗口 19

2.3.6 改变指定图片的大小 21

2.3.7 使用函数rescale()缩放图片 22

2.3.8 使用函数rotate()旋转图片 22

第3章 OpenCV图像视觉处理 25

3.1 OpenCV基础 26

3.1.1 OpenCV和OpenCV-Python介绍 26

3.1.2 安装OpenCV-Python 26

3.2 OpenCV-Python图像操作 27

3.2.1 读取并显示图像 27

3.2.2 保存图像 29

3.2.3 在Matplotlib中显示图像 30

3.2.4 绘图 31

3.2.5 将鼠标作为画笔 34

3.2.6 调色板程序 36

3.2.7 基本的属性操作 37

3.3 OpenCV-Python视频操作 40

3.3.1 读取视频 40

3.3.2 播放视频 41

3.3.3 保存视频 42

3.3.4 改变颜色空间 43

3.3.5 视频的背景分离 45

第4章 dlib机器学习和图像处理 49

4.1 dlib介绍 50

4.2 dlib基本的人脸检测 50

4.2.1 人脸检测 50

4.2.2 使用命令行进行人脸识别 52

4.2.3 检测人脸关键点 54

4.2.4 基于CNN的人脸检测器 56

4.2.5 在摄像头中识别人脸 58

4.2.6 人脸识别验证 59

4.2.7 全局优化 60

4.2.8 人脸聚类 62

4.2.9 抖动采样和增强 64

4.2.10 人脸和姿势采集 65

4.2.11 物体追踪 66

4.3 SVM分类算法 67

4.3.1 二进制SVM分类器 68

4.3.2 Ranking SVM算法 69

4.3.3 Struct SVM多分类器 72

4.4 自训练模型 75

4.4.1 训练自己的模型 75

4.4.2 自制对象检测器 78

第5章 face_recognition人脸识别 83

5.1 安装face_recognition 84

5.2 实现基本的人脸检测 84

5.2.1 输出显示指定人像人脸特征 84

5.2.2 在指定照片中识别标记出人脸 86

5.2.3 识别出照片中的所有人脸 88

5.2.4 判断照片中是否包含某个人 91

5.2.5 识别出照片中的人是谁 92

5.2.6 摄像头实时识别 93

5.3 深入face_recognition人脸检测 98

5.3.1 检测用户眼睛的状态 99

5.3.2 模糊处理人脸 101

5.3.3 检测两个人脸是否匹配 102

5.3.4 识别视频中的人脸 103

5.3.5 网页版人脸识别器 106

第6章采样、变换和卷积处理 109

6.1 采样 110

6.1.1 最近邻插值采样 110

6.1.2 双线性插值 112

6.1.3 双立方插值 116

6.1.4 Lanczos插值 118

6.2 离散傅里叶变换 119

6.2.1 为什么使用DFT 119

6.2.2 用库NumPy实现DFT 120

6.2.3 用库SciPy实现DFT 121

6.2.4 用快速傅里叶变换算法计算DFT 122

6.3 卷积 124

6.3.1 为什么需要卷积图像 124

6.3.2 使用库SciPy中的函数

convolve2d()进行卷积 124

6.3.3 使用库SciPy中的函数ndimage.convolve()进行卷积 126

6.4 频域滤波 128

6.4.1 什么是滤波器 128

6.4.2 高通滤波器 128

6.4.3 低通滤波器 130

6.4.4 DoG 带通滤波器 130

6.4.5 带阻滤波器 132

第7章图像增强 135

7.1 对比度增强 136

7.1.1 直方图均衡化 136

7.1.2 自适应直方图均衡化 138

7.1.3 对比度拉伸 140

7.1.4 非线性对比度增强 142

7.2 锐化 144

7.2.1 锐化滤波 145

7.2.2 高频强调滤波 148

7.2.3 基于梯度的锐化 152

7.3 减少噪声 156

7.3.1 均值滤波器 156

7.3.2 中值滤波器 158

7.3.3 高斯滤波器 158

7.3.4 双边滤波器 159

7.3.5 小波降噪 160

7.4 色彩平衡 161

7.4.1 白平衡 161

7.4.2 颜色校正 163

7.4.3 调整色调和饱和度 164

7.5 超分辨率 165

7.6 去除运动模糊 167

7.6.1 边缘 167

7.6.2 逆滤波 169

7.6.3 统计方法 170

7.6.4 盲去卷积 171

第8章图像特征提取 173

8.1 图像特征提取方法 174

8.2 颜色特征 174

8.2.1 颜色直方图 174

8.2.2 其他颜色特征提取方法 176

8.3 纹理特征 178

8.3.1 灰度共生矩阵 178

8.3.2 方向梯度直方图 180

8.3.3 尺度不变特征变换 181

8.3.4 小波变换 182

8.4 形状特征 184

8.4.1 边界描述子 184

8.4.2 预处理后的轮廓特征 188

8.4.3 模型拟合方法 190

8.4.4 形状上的变换 193

8.5 基于LoG、DoG和DoH的斑点检测器 196

8.5.1 LoG滤波器 197

8.5.2 DoG滤波器 198

8.5.3 DoH算法 200

第9章图像分割 203

9.1 图像分割的重要性 204

9.2 基于阈值的分割 204

9.2.1 灰度阈值分割 205

9.2.2 彩色阈值分割 206

9.3 基于边缘的分割 207

9.3.1 Canny边缘检测 207

9.3.2 边缘连接方法 208

9.4 基于区域的分割 209

9.4.1 区域生长算法 209

9.4.2 图割算法 212

9.4.3 基于聚类的分割算法 213

9.5 基于图论的分割 215

9.5.1 图割算法 215

9.5.2 最小生成树算法 215

9.6 基于深度学习的分割 217

9.6.1 FCN 217

9.6.2 U-Net 219

9.6.3 DeepLab 220

9.6.4 Mask R-CNN 220

第10章目标检测 223

10.1 目标检测概述 224

10.1.1 目标检测的步骤 224

10.1.2 目标检测的方法 224

10.2 YOLO v5 225

10.2.1 YOLO v5的改进 225

10.2.2 基于YOLO v5的训练、验证和预测 226

10.3 语义分割 242

10.3.1 什么是语义分割 242

10.3.2 DeepLab语义分割 244

10.4 SSD目标检测 245

10.4.1 摄像头目标检测 246

10.4.2 基于图像的目标检测 247

第11章图像分类 249

11.1 图像分类介绍 250

11.2 基于特征提取和机器学习的图像分类 250

11.2.1 图像分类的基本流程 250

11.2.2 基于scikit-learn机器学习的图像分类 251

11.2.3 分类算法 254

11.2.4 聚类算法 257

11.3 基于卷积神经网络的图像分类 259

11.3.1 卷积神经网络的基本结构 259

11.3.2 第一个卷积神经网络程序 262

11.3.3 使用卷积神经网络进行图像分类 267

11.4 基于迁移学习的图像分类 279

11.4.1 迁移学习介绍 279

11.4.2 基于迁移学习的图片分类器 280

11.5 基于循环神经网络的图像分类 284

11.5.1 循环神经网络介绍 284

11.5.2 实战演练 285

11.6 基于卷积循环神经网络的图像分类 286

11.6.1 卷积循环神经网络介绍 286

11.6.2 CRNN图像识别器 287

第12章国内常用的第三方人脸识别平台 291

12.1 百度AI开放平台 292

12.1.1 百度AI开放平台介绍 292

12.1.2 使用百度AI之前的准备工作 292

12.1.3 基于百度AI平台的人脸识别 296

12.2 科大讯飞AI开放平台 301

12.2.1 科大讯飞AI开放平台介绍 301

12.2.2 申请试用 301

12.2.3 基于科大讯飞AI的人脸识别 302

第13章斗转星移换图系统 311

13.1 背景介绍 312

13.1.1 CycleGAN的作用 312

13.1.2 CycleGAN的原理 312

13.2 系统模块架构 313

13.3 设置数据集 313

13.4 训练数据 315

13.4.1 加载图像 315

13.4.2 辅助功能 316

13.4.3 生成对抗网络模型 319

13.4.4 训练CycleGAN模型 322

13.5 图像转换 326

13.6 调试运行 328

第14章智能OCR文本检测识别系统 333

14.1 OCR系统介绍 334

14.1.1 OCR的基本原理和方式 334

14.1.2 深度学习对OCR的影响 335

14.1.3 与OCR相关的深度学习技术 335

14.2 OCR项目介绍 336

14.3 准备模型 337

14.3.1 文本检测模型 337

14.3.2 文本识别模型 337

14.4 创建工程 337

14.4.1 工程配置 338

14.4.2 配置应用程序 338

14.4.3 导入模型 338

14.5 具体实现 339

14.5.1 页面布局 339

14.5.2 实现主Activity 339

14.5.3 图像操作 343

14.5.4 运行OCR模型 347

14.6 调试运行 354

商品参数

基本信息
出版社	清华大学出版社
ISBN	9787302664666
条码	9787302664666
编者	王卓,刘德民编
译者	--
出版年月	2024-07-01 00:00:00.0
开本	32开
装帧	平装
页数	736
字数	459000
版次	1
印次	1
纸张	一般胶版纸

商品评论

暂无商品评论信息 [发表商品评论]

商品咨询

暂无商品咨询信息 [发表商品咨询]