无法使用TensorFlow对象检测API训练具有更大输入分辨率的SSD接收V2

2条回答

网友

1楼 · 编辑于 2024-06-06 09:32:17

因为您的数据中有小对象，所以我建议您尝试以这种方式对640x640图片进行二次采样

…其中“黑色640x640”是您的原始图像。当您了解这些技巧时，您可以通过随机位置采样300x300图像（上面的蓝色、绿色和红色矩形图）轻松获得，从而从该图像中可靠地呈现您的原始图像，直接与SSD Inception V2兼容。也许你可以用这种方法进行可靠的物体识别？训练和推理

另一种利用“众所周知的主干SSD Inception V2的全面深入智能，但仅适用于300x300输入图像”的方法是以以下方式并行分割图像

…这意味着您将为SSD Inceptions-V2的并行拷贝配置300x300大小的输入映像的静态位置。并且，应用简单的“计数逻辑”，例如，计算原始640x640图像中小对象的总数

我希望这些想法能帮助你解决最初的问题

网友

2楼 · 编辑于 2024-06-06 09:32:17

2016年推出的原始SSD paper设计了两种特定的输入图像大小300x300和512x512。然而，这方面的主干是Mobilenet（考虑到速度是主要因素）。您可以尝试将图像大小调整为512x512，然后进行训练。然而，考虑到回购协议将300x300作为默认值，可能意味着当输入为该大小而不是任何其他大小时，模型工作得最好

然而，还有许多其他模型允许输入大小为640x640

在Tensorflow models zoo-version 1中，您有ssd_resnet50_v1{a2}，在version 2中，您有许多其他SSD和EfficientSet变体，它们支持640x640（但是有不同的主干）

通过使用上述模型进行培训，您可能会获得更好的结果

相关问题更多 >

编程相关推荐

热门问题

热门文章