CNTK快速RCNN图像预测结果边界盒大小总是跟随图像大小

2024-03-28 09:38:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我是CNTK和所有机器学习框架的新手。我尝试用更快的RCNN和CNTK做图像识别处理。我修改了“检测演示.py“引用我自己的数据集(阳性、阴性、测试图像,最后是预测图像)。你知道吗

数据集是基础地图区域(您可以想象类似google地图的东西)。有些区域被认为是A类(标记为A),有些区域被认为是B类(标记为B),有些区域被认为是C类(标记为C),等等。所以我想通过使用CNTK中的另一组底图作为预测图像来预测这些区域及其类别。你知道吗

无论我的预测图像大小有多大,我总是使用相同的缩放级别,相同的分辨率(dpi,每单元米数)。你知道吗

在我的第一张预测图像(大约3200x3200像素)上,系统生成的预测边界框很少,平均大小大约是我预测图像大小的一半。所以当我使用更大的图像尺寸时,我希望预测边界盒的尺寸是一样的。但是,当我使用较大的图像大小(约9000 x 9000像素)进行预测时,系统生成的预测边界框也很少,平均大小约为我预测图像大小的一半。这一切都在继续。当我把一个预测图像的大小是原来的数倍(大约18000 x 18000像素)并再次运行预测时,系统生成的预测边界框也很少,平均大小大约是我预测图像大小的一半。在所有这些过程中,训练数据是相同的,没有变化。它仍然使用相同的模型和设置。你知道吗

这在CNTK正常吗?如何得到尺寸稳定的预测边界盒结果?为什么预测边界盒的大小结果不试图遵循标注的训练数据边界的平均大小?你知道吗

期待一些建议。。。你知道吗


Tags: 数据标记图像机器框架区域尺寸地图