作者:李轩涯、曹焯然、计湘婷
页数:264
出版社:清华大学出版社
出版日期:2023
ISBN:9787302641773
高清校对版pdf(带目录)
前往页尾底部查看PDF电子书
内容简介
本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用。本书涵盖计算机视觉领域的众多方面,包含图像分类、目标检测、图像分割、视频分类以及图像生成等领域,并通过大量的实践案例向读者演示如何编写计算机视觉应用程序,从而帮助读者深入理解计算机视觉的核心概念和技术。
本书可以作为一本实用的计算机视觉实践指南,无论对于从事计算机视觉领域的专业人士,还是对计算机视觉感兴趣的初学者,本书都值得阅读和收藏。
本书特色
本书是一本基于PaddlePaddle深度学习框架的实践性计算机视觉教材,重点关注计算机视觉在实际中的应用,理论翔实,实用性极强。
目录
第1章Python基础
1.1实践一: 九九乘法表
1.2实践二: 随机数生成与排序
1.3实践三: 批量文件遍历、复制、重命名
1.4实践四: 图像直方图统计
1.5实践五: 数据统计分析及可视化
1.6实践六: 图像预处理
第2章图像分类
2.1实践一: 基于深度神经网络的宝石分类
2.2实践二: 基于卷积神经网络的美食识别
2.3实践三: 基于VGG系列网络的场景图像分类
2.4实践四: 基于ResNet系列模型的车辆图像分类实践
2.5实践五: 基于Vision Transformer的CIFAR10分类
第3章目标检测
3.1实践一: 基于Faster RCNN模型的瓷砖瑕疵检测(两阶段目标检测)
3.2实践二: 基于YOLOV3/PP瞃OLO模型的昆虫检测(一阶段目标检测)
3.3实践三: 基于DETR模型的目标检测
第4章图像分割
4.1实践一: 基于U睳et/DeepLabV3 Plus模型的宠物图像分割
4.2实践二: 基于PaddleSeg的人像视频分割
4.3实践三: 基于PSPNet模型的人体图像分割
4.4实践四: 基于Swin睻Net模型的医学图像分割
第5章视频分类
5.1实践一: 基于TSN模型的视频分类
5.2实践二: 基于ECO模型的视频分类
5.3实践三: 基于TimeSformer模型的视频分类
第6章图像生成
6.1实践一: 基于GAN模型的时尚衣服生成
6.2实践二: 基于PaddleGAN的图像超分辨率
6.3实践三: 基于DCGAN模型的人脸图像生成
6.4实践四: 基于Pix2Pix模型的图像翻译
6.5实践五: 基于CycleGAN模型的图像风格迁移
参考文献
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:https://www.xiazainiu.com/Wd1qk_5_11084.html