智能滑动滑动窗口?
在滑动窗口的物体检测器中,能不能更“聪明”地进行物体检测呢?比如说,如果一个人正在找车,他们不会去天上找车。但是,使用滑动窗口的物体检测器会把窗口滑过整个图像(包括天空),然后在每个窗口上运行物体分类器,这样就浪费了很多时间。有没有什么技术可以确保它只在合理的地方进行检测呢?
编辑
我明白我们至少要看一遍所有的地方,但我不想在每个窗口上都运行一个复杂的分类器。也许可以先用一个简单的分类器进行预分类?
1 个回答
2
你有没有考虑过使用显著性检测算法?显著性检测算法可以告诉你在一张图片中,人类最可能关注的地方在哪里。举个例子,在一片开阔的田野中,天空的显著性就比较低,而人则显著性很高。
你可以先把图片放进显著性检测算法里,然后再进行阈值处理,找出需要搜索的区域,而不是整张图片。
一个很好的算法是Stas Goferman提出的:上下文感知显著性检测 - http://webee.technion.ac.il/~ayellet/Ps/10-Saliency.pdf。
这里还有一些代码可以帮助你入门:https://sites.google.com/a/jyunfan.co.cc/site/opensource-1/contextsaliency
不过不幸的是,这些代码是用MATLAB写的,而你想用Python。不过,numpy / scipy
和MATLAB之间有很多相似之处,希望这能帮助你如果你想把代码转写成Python。
快去看看吧!