回归中关节坐标输出形状的几个问题

2024-05-16 04:03:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我对cnn回归问题的输出形状有一些疑问。
假设我有图像形状

image shape = (105, 157, 3)

这个图像有14每个图像的联合坐标(14, 3, 10000)

我猜10000就是图片的数量

每个关节坐标看起来像

y=array([[145.82985678,  95.5022898 ,   1.        ],
         [111.87785389,  83.38437237,   1.        ],
         [  0.        , -27.29260682,   0.        ],
         [146.22287032,  67.62016267,   1.        ],
         [114.716285  ,  89.0394005 ,   1.        ],
         [147.03073148,  90.65512282,   1.        ],
         [  0.        , -27.29260682,   0.        ],
         [  0.        , -27.29260682,   0.        ],
         [  0.        , -27.29260682,   0.        ],
         [102.99138111,  63.60269094,   1.        ],
         [107.44553454,  91.85599752,   1.        ],
         [112.68571505, 118.12240233,   1.        ],
         [ 95.72063065,  64.38871802,   1.        ],
         [ 76.74681039,  60.37124629,   1.        ]])

如果我想做一个神经网络,那么神经网络应该有输出,输出应该与这个y真值比较

  1. 输出的形状应该是什么?

  2. 我必须重塑这个y真值的形状是什么?怎么做?


数据集来自Leeds Sports Dataset(LSP):11000个训练图像和1000个测试图像,这些图像来自在外观和发音方面具有挑战性的体育活动。大多数人有150像素的身高。每个人的全身都有14个关节


Tags: 数据图像image数量图片神经网络arraycnn