计算机视觉实践(第2版)

2025-9-15 266 9/15

计算机视觉实践(第2版)

作者:李轩涯、曹焯然、计湘婷

页数:264

出版社:清华大学出版社

出版日期:2023

ISBN:9787302641773

高清校对版pdf(带目录)

前往页尾底部查看PDF电子书

内容简介

本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用。本书涵盖计算机视觉领域的众多方面,包含图像分类、目标检测、图像分割、视频分类以及图像生成等领域,并通过大量的实践案例向读者演示如何编写计算机视觉应用程序,从而帮助读者深入理解计算机视觉的核心概念和技术。

本书可以作为一本实用的计算机视觉实践指南,无论对于从事计算机视觉领域的专业人士,还是对计算机视觉感兴趣的初学者,本书都值得阅读和收藏。

本书特色

本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用,理论翔实,实用性极强。

目录

第1章Python基础
1.1实践一: 九九乘法表
1.2实践二: 随机数生成与排序
1.3实践三: 批量文件遍历、复制、重命名
1.4实践四: 图像直方图统计
1.5实践五: 数据统计分析及可视化
1.6实践六: 图像预处理

第2章图像分类
2.1实践一: 基于深度神经网络的宝石分类
2.2实践二: 基于卷积神经网络的美食识别
2.3实践三: 基于VGG系列网络的场景图像分类
2.4实践四: 基于ResNet系列模型的车辆图像分类实践
2.5实践五: 基于Vision Transformer的CIFAR10分类

第3章目标检测
3.1实践一: 基于Faster RCNN模型的瓷砖瑕疵检测(两阶段目标检测)
3.2实践二: 基于YOLOV3/PP瞃OLO模型的昆虫检测(一阶段目标检测)
3.3实践三: 基于DETR模型的目标检测

第4章图像分割
4.1实践一: 基于U睳et/DeepLabV3 Plus模型的宠物图像分割
4.2实践二: 基于PaddleSeg的人像视频分割
4.3实践三: 基于PSPNet模型的人体图像分割
4.4实践四: 基于Swin睻Net模型的医学图像分割

第5章视频分类
5.1实践一: 基于TSN模型的视频分类
5.2实践二: 基于ECO模型的视频分类
5.3实践三: 基于TimeSformer模型的视频分类

第6章图像生成
6.1实践一: 基于GAN模型的时尚衣服生成
6.2实践二: 基于PaddleGAN的图像超分辨率
6.3实践三: 基于DCGAN模型的人脸图像生成
6.4实践四: 基于Pix2Pix模型的图像翻译
6.5实践五: 基于CycleGAN模型的图像风格迁移

参考文献

PDF更新中
- THE END -

非特殊说明,本博所有文章均为博主原创。