如何更改MediaPipe中Pose的最大姿势数量？

0 投票

1 回答

24 浏览

提问于 2025-04-13 02:05

下面这段官方示例代码运行得很好。不过，这段代码只能在一张图片或视频中找到一个姿势。

https://github.com/google/mediapipe/blob/master/docs/solutions/pose.md

import cv2
import mediapipe as mp
import numpy as np
mp_drawing = mp.solutions.drawing_utils
mp_drawing_styles = mp.solutions.drawing_styles
mp_pose = mp.solutions.pose

# For webcam input:
cap = cv2.VideoCapture(0)
with mp_pose.Pose(                       # <-- Does not have "max_poses" parameter
    min_detection_confidence=0.5,
    min_tracking_confidence=0.5) as pose:
  while cap.isOpened():
    success, image = cap.read()
    if not success:
      print("Ignoring empty camera frame.")
      # If loading a video, use 'break' instead of 'continue'.
      continue

    # To improve performance, optionally mark the image as not writeable to
    # pass by reference.
    image.flags.writeable = False
    image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
    results = pose.process(image)

    # Draw the pose annotation on the image.
    image.flags.writeable = True
    image = cv2.cvtColor(image, cv2.COLOR_RGB2BGR)
    mp_drawing.draw_landmarks(
        image,
        results.pose_landmarks,
        mp_pose.POSE_CONNECTIONS,
        landmark_drawing_spec=mp_drawing_styles.get_default_pose_landmarks_style())
    # Flip the image horizontally for a selfie-view display.
    cv2.imshow('MediaPipe Pose', cv2.flip(image, 1))
    if cv2.waitKey(5) & 0xFF == 27:
      break
cap.release()

根据另一份文档，它指导我们使用PoseLandmarkerOptions()，这个选项可以让我们通过num_poses来进行更改，但上面的mp.solutions.pose.Pose()代码没有这个选项。我希望能在最小修改的情况下重用这段代码。

谢谢！

machine learning image processing mediapipe pose estimation computer vision gesture recognition video analysis pose tracking

1 个回答

MediaPipe Pose 目前的设计是每次只能检测一张图片中的一个姿势。如果你想检测多个姿势，可能需要想一些变通的方法，比如把输入的图片分成多个部分，然后对每个部分进行姿势检测。不过，按照最新的更新，通过这个接口并没有提供一个 max_poses 的选项。这意味着你只能用 MediaPipe 提供的简单方法一次检测一个姿势。记得关注未来的更新，看看有没有变化！

回答于 2025-04-13 由 Python大师

分享举报

如何更改MediaPipe中Pose的最大姿势数量？

1 个回答

撰写回答