数字图像处理
目标识别
注:在界定数字图像处理的覆盖范围时,包含了图像中各个区域的识别,在本章中,我们称这些区域为目标或模式。
模式和模式类
模式:描绘子的组合
模式类:具有某些共同属性的一族模式。
由机器完成的模式识别是对不同的模式赋予不同类别的技术,这种技术是自动的,并且尽可能地减少人的干预。
实践中常用的三种模式组合是向量(用于定量描述)、串和树(用于结构描述)。模式向量由粗体
小写字母表示,如x,y和z,并采取下列形式:
串:串描述适于生成其结构是基于基元的较简单的连接,并且通常是和边界形状有关系的目标模式和其他实体模式。
基于决策理论方法的识别
决策理论方法识别是以使用决策(或判别)函数为基础的。
匹配
基于匹配的识别技术通过一个原型模式向量来表示每个类。根据一种预先定义的度量, 将一个未知模式赋予最接近的类。
最简单的方法是最小距离分类器,最小距离分类器计算该未知模式与每个原型向盘间的(欧氏)距离。它选择最小距离来决策。
模板匹配:当对象物的图案以图像的形式表现时,根据该图案与一幅图像的各部分的相似度判断其是否存在,并求得对象物在图像中位置的操作。
最佳统计分类器
多数测量和判断物理事件的场合,通常会产生随机的模式分类,因此对概率的考虑是十分重要的。而最佳则是平均的,产生分类错误的概率很低。
先验概率:表示在一个对象尚未被测量之前,对于对象所掌握的情况。
条件概率:当给定对象属于类1时。对象直径为x的概率。记为p(x|w1)
贝叶斯理论:将类隶属度先验概率、条件PDF和所进行的度量结合起来,计算出该对象属于每一类的概率,并据此赋予该对象最可能的类别。对象测量后。该对象属于第I类的概率可以根据贝叶斯定理计算:
使用贝叶斯决策的分类器长期风险称为贝叶斯风险
贝叶斯分类器的决策函数:
神经网络识别法
结构:由许多互联的相同的节点(处理单元,PE)构成。每个PE从上游的几个PE接受输入信号,产生一个标量输出,传给下游的一组PE。
处理单元:基本的处理单元的动作为将输入向量同权向量相乘,再经过依次S形变换,即得到输出值。此输出再经过网络地相互连接传递下去,成为许多PE的输入。
多层前馈神经网络
下图 展示了神经网络的结构:
最后输出层输出的值可当做属于这个类的概率,因此哪个值高就可认为它属于这类的概率高。而每个神经元的的形式与前面讨论的感知机模型类似,只是激活函数变成了如下的 ‘S形’函数:
其中,Ij 是网络第 j 层每个节点激活元素的输入, θj 是偏移量,θ0 控制 S 函数的形状。上式对应的S函数如下:
任何一层中的节点输入都是来自前一层输出的加权和,令 K 层为 J 层的前一层,则有:
其中, Ok 为第 k 层的输出
故 hj(Ij) 又可写成如下形式:
结构方法
匹配形状数
两个区域边界之间的相似度k定义为它们的形状书仍保持一致的最大阶。
例如,令a和b代表由4方向链码表示的闭合边界的形状数,如果
那么这两个形状有一个相似度k,其中s代表形状数,下标代表阶。两个形状a和b之间的距离定义为它们的相似度的倒数:
该距离满足如下性质:
K或D都可以用于比较两个形状。如果使用相似度,则k越大,形状就越相似。当使用距离度量时,情形正好相反。
串匹配
假设两个区域边界a和b 已被编码成串,两个串分别表示为a1,a2,…,an和b1, b2,…, bm。令α表示两个串之间的匹配数,如果ak=bk。则匹配出现在第k个位置。不匹配的符号数为:
特征检测和匹配概述
特征点概述
如何高效且准确的匹配出两个不同视角的图像中的同一个物体,是许多计算机视觉应用中的第一步。虽然图像在计算机中是以灰度矩阵的形式存在的,但是利用图像的灰度并不能准确的找出两幅图像中的同一个物体。这是由于灰度受光照的影响,并且当图像视角变化后,同一个物体的灰度值也会跟着变化。所以,就需要找出一种能够在相机进行移动和旋转(视角发生变化),仍然能够保持不变的特征,利用这些不变的特征来找出不同视角的图像中的同一个物体。
为了能够更好的进行图像匹配,需要在图像中选择具有代表性的区域,例如:图像中的角点、边缘和一些区块,在图像识别角点是最容易,也就是说角点的辨识度是最高的。所以,在很多的计算机视觉处理中,都是提取角点作为特征,对图像进行匹配,例如SFM,视觉SLAM等。但是,单纯的角点并不能很好的满足我们的需求,例如:相机从远处得到的是角点,但是在近处就可能不是角点;或者,当相机旋转后,角点就发生了变化。为此,计算机视觉的研究者们设计了许多更为稳定的的特征点,这些特征点不会随着相机的移动,旋转或者光照的变化而变化。例如:SIFT,SURF,ORB等
特征点的构成
1、关键点:关键点指的是该特征点在图像中的位置,有些还具有方向、尺度信息;
2、描述子:描述子通常是一个向量,按照人为的设计的方式,描述关键点周围像素的信息。
通常描述子是按照外观相似的特征应该有相似的描述子设计的。因此,在匹配的时候,只要两个特征点的描述子在向量空间的距离相近,就可以认为它们是同一个特征点。
特征点的匹配
特征点的匹配通常分为三个步骤:
1、提取图像中的关键点,是为了查找图像中具有某些特征(不同的算法有不同的)的像素;
2、根据得到的关键点位置,计算特征点的描述子;
3、根据特征点的描述子,进行匹配;
特征点描述子
定义:从图像中提取到特征的关键点信息,通常只是其在图像的位置信息(有可能包含尺度和方向信息),仅仅利用这些信息无法很好的进行特征点的匹配,所以就需要更详细的信息,将特征区分开来,这就是特征描述子。另外,通过特征描述子可以消除视角的变化带来图像的尺度和方向的变化,能够更好的在图像间匹配。特征的描述子通常是一个精心设计的向量,描述了关键点及其周围像素的信息。
描述子的特性:
不变性:指特征不会随着图像的放大缩小旋转而改变;
鲁棒性:对噪声、光照或者其他一些小的形变不敏感;
可区分性:每一个特征描述子都是独特的,具有排他性,尽可能减少彼此间的相似性。
其中描述子的可区分性和其不变性是矛盾的,一个具有众多不变性的特征描述子,其区*部图像内容的能力就比较稍弱;而如果一个很容易区分不同局部图像内容的特征描述子,其鲁棒性往往比较低。所以,在设计特征描述子的时候,就需要综合考虑这三个特性,找到三者之间的平衡。
特征描述子的不变性主要体现在两个方面:
1、尺度不变性
指的是同一个特征,在图像的不同的尺度空间保持不变。匹配在不同图像中的同一个特征点经常会有图像的尺度问题,不同尺度的图像中特征点的距离变得不同,物体的尺寸变得不同,而仅仅改变特征点的大小就有可能造成强度不匹配。如果描述子无法保证尺度不变性,那么同一个特征点在放大或者缩小的图像间,就不能很好的匹配。为了保持尺度的不变性,在计算特征点的描述子的时候,通常将图像变换到统一的尺度空间,再加上尺度因子。
2、旋转不变性
指的是同一个特征,在成像视角旋转后,特征仍然能够保持不变。和尺度不变性类似,为了保持旋转不变性,在计算特征点描述子的时候,要加上关键点的方向信息。
常用的特征点算法
上面提到图像的特征点包含两个部分:
1、特征点的提取,在图像检测到特征点的位置。
2、特征点的描述,也就是描述子。
在图像中提取到关键点的位置信息后,为了能够更有效的匹配(主要是保证尺度和旋转不变性),通常使用一个向量来描述关键点及其周围的信息。特征的描述子,在特征点的匹配中是非常重要的。但具体到一个算法来说,可能其既有特征点的提取算法也有特征点描述子的算法,也有可能其仅仅是一个特征点提取算法或者是特征点的描述子算法。
本文地址:https://blog.csdn.net/m0_45805664/article/details/107448498