3.1 滑动窗法
目标检测是通过滑动窗法来检测输入图像的子图像中是否存在感兴趣的目标。每一个子窗口都有可能包含感兴趣目标。但是,在一幅VGA图像中存在23,507,020,800个可能的子窗口,且对一幅尺寸大小为n*n的图像,可能的子窗口数以的数量级增加(证明见APP.A.1)。我们采用以下约束条件来把搜索区域限制到子区域R。首先,我们假设感兴趣区域的宽高比不变;再者,我们在两个相邻的子窗口间引入余量
、
;其中,
、
的大小设为初始边界框大小的1/10。为了实现多尺度搜索,我们设置尺度因子
,
,尺度相对于原始目标边界框的大小随尺度因子变化。为了避免尺度过小,我们要求子窗口的面积不得低于25像素。通过以上约束,所有子窗口R的集合的大小为:
图3.1 对每一滑动子窗口独立地进行目标检测。级联分类器可以降低计算量。输入图像源自SPEVI数据库
其中,w、h分别表示初始边界框的宽和高;n、m分别表示图像的宽和高。App.A.1给出了等式3.1的演算过程。对一幅VGA图像,如果初始边界框的大小为w=80、h=60,则有146,190个子窗口。因为对每个子窗口的检测是独立的,所以我们可以根据系统可用核的数量,采用尽可能多的线程来对子窗口进行检测。