我试着判断一个人坐姿的质量。(例如,端坐=好/蹲坐=坏)使用网络摄像头。你知道吗
第一次尝试:
- 图像获取(使用OpenCV python绑定)
- 创建一个数据集,将带标签的图像分为好/坏
- 特征检测(快速)
- 在具有该特征的数据集上训练神经元网络(ANN\u MLP)
结果还行,但有一些限制:
- 对网络摄像头的移动、位移、其他人、物体等不具有不变性
- 我不确定快速功能是否适合
- 我对机器学习非常陌生,想尝试更复杂的TensorFlow方法:
第二次尝试:
我尝试了通过Tensorflow PoseNet检测人体姿势
并给出了一个确定人体各部位位置概率的小算例。所以现在的挑战是从PoseNet的输出中检测出一个人坐姿的质量。你知道吗
好的方法是什么:
- 训练第二个TF模型,得到人体各部位的概率
姿势作为输入和输出好/坏姿势?(因此PoseNet被用作奇特的特征检测器)
- 重做PoseNet模型以满足我的输出需求并重新培训它?你知道吗
- 从PoseNet迁移学习(我刚刚读到了它,但不知道它是如何或是否适用于这里)?你知道吗
- 或者完全不同的方法?你知道吗
Tags:
目前没有回答
相关问题 更多 >
编程相关推荐