
作者:章毓晋
页数:468
出版社:清华大学出版社
出版日期:2024
ISBN:9787302656548
高清校对版pdf(带目录)
前往页尾底部查看PDF电子书
内容简介
本册书是《图像工程》第5版的下册,比较全面地介绍图像工程的第三层次——图像理解的基础概念、基本原理、典型方法、实用技术以及国际上相关内容研究的新成果。可作为相关专业研究生教材。本册书主要分为4个单元。第1单元(包含第2~5章)介绍采集表达技术,第2单元(包含第6~9章)介绍景物重建技术,第3单元(包含第10~12章)介绍场景解释技术,第4单元(包含第13~16章)介绍研究示例。书中还提供了大量例题、思考题和练习题,并对部分练习题提供了解答。书末还给出了主题索引。
作者简介
章毓晋,1989年获比利时列日大学应用科学博士学位。1989—1993年为荷兰德尔夫特大学博士后及研究人员。1993年到中国北京清华大学工作,1997年被聘为教授,1998年被评为博士生导师。2014年成为教学科研系列长聘教授。2003年学术休假期间同时被聘为新加坡南洋理工大学访问教授。 在清华大学,先后开出并讲授10多门本科生和研究生课程。在南洋理工大学,开出并讲授过研究生课程:“现代图像分析(英语)”。已编写出版了图像工程系列教材第1版、第2版、第3版和第4版,以及其他中英文图像工程教材约20本,还翻译出版了多本国外图像工程教材。已在国内外发表了30多篇教学研究论文。 主要科学研究领域为其积极倡导的图像工程(图像处理、图像分析、图像理解及其技术应用)和相关学科。从1996年起已连续二十八年对中国图像工程的研究及主要文献进行了系统的年度分类总结综述。已在国内外发表了500多篇图像工程研究论文,出版了专著《图象分割》,《基于内容的视觉信息检索》,《基于子空间的人脸识别》,编著了《英汉图像工程辞典》(第1版和第2版)和《图像工程技术选编》,主编了《Advances in Image and Video Segmentation》,《Semantic-Based Visual Information Retrieval》,《Advances in Face Image Analysis: Techniques and Technologies》。
现为中国图象图形学学会名誉监事长,会士;国际光学工程协会(SPIE)会士(因在图像工程方面的成就)。
本书特色
本书内容体系连续贯通,依次学习能帮助读者全面、深入、系统地学习图像处理技术。相比于国内外同类教材,本书与最新科研成果结合比较紧密,每次再版均充实了最新研究成果和得到广泛使用的典型技术,新内容的引进比较早。在教材所引用和参考的文献中,作者自己发表的就有100多篇,科研成果的引入提高了内容的先进性。
从教学的角度考虑,本书具有以下特点:(1)尽快进入主题:把先修或预备内容安排在需先修部分的同一章之前,没有安排专门的基础知识章,更加实用,也突出了课程主线的内容。
(2)内容模块化:正式内容分别结合进4个相关的学习单元,每个单元都围绕一个主题(自成体系),既加强了全书的系统性和结构性,也有利于复习考核。
(3)配套资源丰富:每章配套PPT课件、微课视频、随堂测试、扩展阅读等内容,便于课堂学习和课后自学。
(4)资源开放共享:总结和复习、部分思考题和练习题解答、参考文献、PPT课件、微课视频、随堂测试等资源均已电子化,扫描对应二维码即可下载。
第1版获全国普通高等学校优秀教材一等奖;第2版被评为全国普通高等教育“十一五”精品教材;第3版被评为2013年北京高等教育精品教材;第4版获全国优秀教材(高等教育)二等奖,评为“十二五”普通高等教育本科国家级规划教材。
目录
第1章绪论
1.1图像工程的发展
1.1.1基本概念和定义概括
1.1.2图像工程发展情况回顾
1.2图像理解及相关学科
1.2.1图像理解
1.2.2计算机视觉
1.2.3其他相关学科
1.2.4图像理解的应用领域
1.3图像理解理论框架
1.3.1马尔视觉计算理论
1.3.2对马尔理论框架的改进
1.3.3关于马尔重建理论的讨论
1.3.4新理论框架的研究
1.3.5从心理认知出发的讨论
1.4深度学简介
1.4.1图像理解中的深度学
1.4.2卷积经网络的基本概念
1.4.3深度学核心技术
1.4.4深度学的应用
1.5内容框架和点
总结和复最
随堂测试最
第1单元采 集 表 达
第2章摄像机成像和标定
2.1视觉过程
2.2亮度成像模型
2.2.1光度学和光源
2.2.2从亮度到照度
2.3空间成像模型
2.3.1基本摄像机模型
2.3.2近似投影模式
2.3.3一般摄像机模型
2.3.4透镜畸变
2.3.5通用成像模型
2.4摄像机标定
2.4.1标定方法分类
2.4.2标定程序和参数
2.4.3两级标定法
2.4.4度提升
2.5在线摄像机外参数标定方法
2.5.1车道线检测与数据筛选
2.5.2化重投影误差
2.6自标定方法
2.7结构光主动视觉系统的标定
2.7.1投影模型和标定
2.7.2图案分离
2.7.3计算单应性矩阵
2.7.4计算标定参数
总结和复最
随堂测试最
第3章压缩感知与成像
3.1压缩感知概述
3.2稀疏表达
3.3测量矩阵及性
3.3.1采样/测量模型
3.3.2测量矩阵性
3.4解码重构
3.4.1重构原理
3.4.2测量矩阵的校准
3.4.3典型重构算法
3.4.4基于深度学的重构算法
3.5稀疏编码与字典学
3.5.1字典学与矩阵分解
3.5.2非负矩阵分解
3.5.3端元提取
3.5.4稀疏编码
3.6压缩感知的成像应用
3.6.1单像素相机
3.6.2压缩感知磁共振成像
总结和复最
随堂测试最
第4章深度信息采集
4.1高维图像和成像方式
4.1.1高维图像种类
4.1.2本征图像和非本征图像
4.1.3深度成像方式
4.2双目成像模式
4.2.1双目横向模式
4.2.2双目会聚横向模式
4.2.3双目轴向模式
4.3深度图像直接采集
4.3.1飞行时间法
4.3.2结构光法
4.3.3莫尔等高条纹法
4.3.4深度和亮度图像同时采集
4.4显微镜3睤分层成像
4.4.1景深和焦距
4.4.2显微镜3睤成像
4.4.3共聚焦显微镜3睤成像
4.5等基线多摄像机组
4.5.1图像采集
4.5.2图像合并方法
4.6单摄像机多镜反射折射系统
4.6.1总体系统结构
4.6.2成像和标定模型
总结和复最
随堂测试最
第5章3睤景物表达
5.1曲线和曲面的局征
5.1.1曲线局征
5.1.2曲面局征
5.23睤表面表达
5.2.1参数表达
5.2.2表面朝向表达
5.3等值面的构造和表达
5.3.1行进立方体算法
5.3.2覆盖算法
5.3.3两种算法比较
5.4从并行轮廓值3睤表面
5.53睤实体表达
5.5.1基本表达方案
5.5.2广义圆柱体表达
总结和复最
随堂测试最
第2单元景 物 重 建
第6章双目立体视觉
6.1立体视觉模块
6.2基于区域的双目立体匹配
6.2.1模板匹配
6.2.2立体匹配
6.3基于征的双目立体匹配
6.3.1基本步骤
6.3.2尺度不变征变换
6.3.3加速鲁棒性征
6.3.4动态规划匹配
6.4基于深度学的立体匹配
6.4.1方法分类
6.4.2立体匹配网络
6.4.3基于征级联CNN的匹配
6.5视差图误差检测与校正
总结和复最
随堂测试最
第7章多目立体视觉
7.1水平多目立体匹配
7.1.1水平多目图像
7.1.2倒距离
7.2正交三目立体匹配
7.2.1基本原理
7.2.2基于梯度分类的正交匹配
7.3多目立体匹配
7.3.1任意排列三目立体匹配
7.3.2正交多目立体匹配
7.4亚像素级视差
7.4.1统计分布模型
7.4.2亚像素级视差计算
总结和复最
随堂测试最
第8章单目多图像景物恢复
8.1单目景物恢复
8.2光度立体法
8.2.1景物亮度和图像亮度
8.2.2表面反射性和亮度
8.2.3景物表面朝向
8.2.4反射图和亮度约束方程
8.2.5光度立体法求解
8.3光度立体法进展
8.3.1光源标定
8.3.2非朗伯表面反射模型
8.3.3彩色光度立体法
8.3.43睤重建方法
8.4基于GAN的光度立体法标定
8.4.1网络结构
8.4.2损失函数
8.5从运动求取结构
8.5.1光流和运动场
8.5.2光流方程求解
8.5.3光流与表面取向
8.5.4光流与相对深度
8.6从分割剪影恢复形状
总结和复最
随堂测试最
第9章单目单图像景物恢复
9.1单幅图像深度估计
9.1.1有监督学方法
9.1.2无监督学方法
9.1.3半监督学方法
9.2从影调恢复形状
9.2.1影调与形状
9.2.2亮度方程求解
9.3混合表面投影下的SFS
9.3.1改进的Ward反射模型
9.3.2投影下的图像亮度约束方程
9.3.3图像亮度约束方程求解
9.3.4基于Blinn睵hong反射模型
9.3.5新图像亮度约束方程求解
9.4纹理与表面朝向
9.4.1单目成像和畸变
9.4.2由纹理变化恢复朝向
9.4.3检测线段纹理消失点
9.4.4确定图像外消失点
9.5由焦距确定深度
9.6根据三点估计位姿
总结和复最
随堂测试最
第3单元场 景 解 释
第10章知识表达和推理
10.1知识概述
10.2场景知识
10.2.1模型
10.2.2属性图
10.2.3基于知识的建模
10.3过程知识
10.4知识表达
10.4.1知识表达要求
10.4.2知识表达类型
10.4.3基本知识表达方案
10.4.4人工智能中的知识表达
10.4.5图像理解系统中的知识模块
10.5逻辑系统
10.5.1谓词演算规则
10.5.2利用定理证明推理
10.5.3推理方法分类
10.6语义网
10.7产生式系统
总结和复最
随堂测试最
第11章广义匹配
11.1匹配概述
11.1.1匹配策略和类别
11.1.2匹配和配准
11.1.3匹配评
11.2目标匹配
11.2.1对应点匹配
11.2.2字符串匹配
11.2.3惯量等效椭圆匹配
11.2.4形状矩阵匹配
11.2.5结构匹配和量度
11.3动态模式匹配
11.4关系匹配
11.5图同构匹配
11.5.1图论简介
11.5.2图同构和匹配
11.6线条图标记和解释
11.6.1轮廓标记
11.6.2结构推理
11.6.3回溯标记
11.7借助匹配实现配准
11.7.1基于征匹配的异构遥感图像配准
11.7.2基于空间关系推理的图像匹配
11.8多模态图像匹配
11.8.1基于区域的技术
11.8.2基于征的技术
总结和复最
随堂测试最
第12章场景分析和语义解释
12.1场景理解概述
12.2模糊推理
12.2.1模糊集合和模糊运算
12.2.2模糊推理方法
12.3遗传算法图像解释
12.3.1遗传算法原理
12.3.2语义分割和解释
12.4场景目标标记
12.5场景分类
12.5.1词袋/征模型
12.5.2pLSA模型
12.5.3LDA模型
12.6遥感图像判读
12.6.1遥感图像判读方法分类
12.6.2遥感图像判读知识图谱
12.7混合增强视觉认知
12.7.1从计算机视觉感知到计算机视觉认知
12.7.2混合增强视觉认知
相关技术
总结和复最
随堂测试最
第4单元研 究 示 例
第13章同时定位和制图
13.1SLAM概况
13.1.1激光SLAM
13.1.2视觉SLAM
13.1.3对比和结合
13.2激光SLAM算法
13.2.1Gmapping算法
13.2.2Cartographer算法
13.2.3LOAM算法
13.3视觉SLAM算法
13.3.1ORB睸LAM系列算法
13.3.2LSD睸LAM算法
13.3.3SVO算法
13.4群体机器人和群体SLAM
13.4.1群体机器人的性
13.4.2群体SLAM要解决的问题
13.5SLAM的新动向
13.5.1SLAM与深度学的结合
13.5.2SLAM与多智能体的结合
总结和复最
随堂测试最
第14章多传感器图像信息融合
14.1信息融合概述
14.2图像融合
14.2.1图像融合的主要步骤
14.2.2图像融合的三个层次
14.2.3图像融合效果评
14.3像素级融合方法
14.3.1基本融合方法
14.3.2融合方法的结合
14.3.3小波融合时的佳分解层数
14.3.4压缩感知图像融合
14.3.5像素级融合示例
14.4双能透射和康普顿背散射融合
14.4.1成像技术的互补性分析
14.4.2互补融合
14.5高光谱图像空间光谱征提取
14.5.1传统高光谱征提取方法
14.5.2基于深度学的空间光谱征
提取方法
14.6征级和决策级融合方法
14.6.1贝叶斯法
14.6.2证据推理法
14.6.3粗糙集理论法
14.7多源遥感图像融合
14.7.19种多源遥感数据源
14.7.2多源遥感图像融合文献
14.7.3遥感图像的空间补馄兹诤
14.7.4基于深度循环残差网络的融合
总结和复最
随堂测试最
第15章基于内容的图像和视频检索
15.1图像和视频检索原理
15.2视觉征的匹配和检索
15.2.1颜色征匹配
15.2.2纹理征计算
15.2.3多尺度形状
征
15.2.4综合征检索
15.3基于运动征的视频检索
15.3.1全局运动征
15.3.2局运动征
15.4基于分层匹配追踪的检索
15.4.1检索框图
15.4.2单层图像征提取
15.4.3多层征提取和图像检索
15.4.4结合颜色直方图
15.5视频节目分析和索引
15.5.1新闻视频结构化
15.5.2体育比赛视频排序
15.5.3家庭录像视频组织
15.6语义分类检索
15.6.1基于视觉关键词的图像分类
15.6.2高层语义与气氛
15.7基于深度学的跨模态检索
15.7.1跨模态检索技术分类
15.7.2图像标题自动生成
15.8图像检索中的哈希
15.8.1有监督哈希
15.8.2非对称监督深度离散哈希
15.8.3跨模态图像检索中的哈希
总结和复最
随堂测试最
第16章时空行为理解
16.1时空技术
16.2时空兴趣点
16.3动态轨迹学和分析
16.3.1自动场景建模
16.3.2学路径
16.3.3自动活动分析
16.4动作分类和识别
16.4.1动作分类
16.4.2动作识别
16.5结合姿态和上下文的动作分类
16.5.1基于姿态模型的动作分类器
16.5.2基于上下文的动作分类器
16.6活动和行为建模
16.6.1动作建模
16.6.2活动建模和识别
16.7主体与动作联合建模
16.7.1单标签主体捕作识别
16.7.2多标签主体捕作识别
16.7.3主体捕作语义分割
16.8基于关节点的行为识别
16.8.1使用CNN作为主干
16.8.2使用RNN作为主干
16.8.3使用GCN作为主干
16.8.4使用混合网络作为主干
16.9异常事件检测
16.9.1异常事件检测方法分类
16.9.2基于卷积自编码器块学的检测
16.9.3基于单类经网络的检测
总结和复最
随堂测试最
附录A视觉和视知觉
A.1视知觉概述
A.2视觉性
A.2.1视觉的空间性
A.2.2视觉的时间性
A.2.3视觉的亮度性
A.3形状知觉
A.3.1图形和背景
A.3.2轮廓和主观轮廓
A.3.3几何图形错觉
A.4空间知觉
A.4.1两种空间知觉观
A.4.2非视觉性深度线索
A.4.3双目深度线索
A.4.4单目深度线索
A.5运动知觉
A.6生物视觉与立体视觉
A.6.1生物视觉和双目视觉
A.6.2从单目到双目立体
主题索引
分思考题和练题解答最
参考文献最
非特殊说明,本博所有文章均为博主原创。
如若转载,请注明出处:https://www.xiazainiu.com/Wd1qk_5_19187.html