ตรวจจับท่าทางด้วย ML Kit บน Android

ML Kit มี SDK ที่เพิ่มประสิทธิภาพ 2 รายการสำหรับการตรวจจับท่าทาง

ชื่อ SDK	pose-detection	pose-detection-accurate
การใช้งาน	โค้ดและชิ้นงานจะลิงก์กับแอปแบบคงที่ในระหว่างเวลาบิลด์	โค้ดและชิ้นงานจะลิงก์กับแอปแบบคงที่ในระหว่างเวลาบิลด์
ผลกระทบต่อขนาดแอป (รวมถึงโค้ดและชิ้นงาน)	~10.1MB	~13.3MB
ประสิทธิภาพ	Pixel 3XL: ~30FPS	Pixel 3XL: ~23 FPS ด้วย CPU, ~30 FPS ด้วย GPU

ลองเลย

ลองใช้แอปตัวอย่างเพื่อ ดูตัวอย่างการใช้งาน API นี้

ก่อนเริ่มต้น

API นี้ต้องใช้ Android API ระดับ 23 ขึ้นไป ตรวจสอบว่าไฟล์บิลด์ ของแอปใช้ค่า minSdkVersion เป็น 23 ขึ้นไป

ในไฟล์ build.gradle ระดับโปรเจ็กต์ ให้ตรวจสอบว่าได้รวมที่เก็บ Maven ของ Google ไว้ในส่วน buildscript และ allprojects
เพิ่มทรัพยากร Dependency สำหรับไลบรารี ML Kit สำหรับ Android ลงในไฟล์ Gradle ระดับแอปของโมดูล ซึ่งโดยปกติจะเป็นไฟล์ app/build.gradle ดังนี้
```
dependencies {
  // If you want to use the base sdk
  implementation 'com.google.mlkit:pose-detection:18.0.0-beta5'
  // If you want to use the accurate sdk
  implementation 'com.google.mlkit:pose-detection-accurate:18.0.0-beta5'
}
```

1. สร้างอินสแตนซ์ของ `PoseDetector`

ตัวเลือก `PoseDetector`

หากต้องการตรวจจับท่าทางในรูปภาพ ให้สร้างอินสแตนซ์ของ PoseDetector ก่อน แล้วระบุการตั้งค่าเครื่องตรวจจับ (ไม่บังคับ)

โหมดการตรวจจับ

PoseDetector ทำงานในโหมดการตรวจจับ 2 โหมด โปรดเลือกโหมดที่ตรงกับกรณีการใช้งานของคุณ

STREAM_MODE (ค่าเริ่มต้น): เครื่องตรวจจับท่าทางจะตรวจจับบุคคลที่โดดเด่นที่สุดในรูปภาพก่อน แล้วจึงเรียกใช้การตรวจจับท่าทาง ในเฟรมต่อๆ ไป ระบบจะไม่ดำเนินการขั้นตอนการตรวจหาบุคคล เว้นแต่บุคคลนั้นจะถูกบดบัง หรือตรวจไม่พบอีกต่อไปด้วยความเชื่อมั่นสูง เครื่องตรวจจับท่าทางจะ พยายามติดตามบุคคลที่โดดเด่นที่สุดและแสดงท่าทางของบุคคลนั้นในแต่ละ การอนุมาน ซึ่งจะช่วยลดเวลาในการตอบสนองและทำให้การตรวจจับราบรื่นขึ้น ใช้โหมดนี้เมื่อคุณ ต้องการตรวจจับท่าทางในสตรีมวิดีโอ
SINGLE_IMAGE_MODE: เครื่องตรวจจับท่าทางจะตรวจจับบุคคล แล้วจึงเรียกใช้การตรวจจับท่าทาง ขั้นตอนการตรวจหาบุคคลจะทำงานกับทุกรูปภาพ ดังนั้นเวลาในการตอบสนองจะนานขึ้น และจะไม่มีการติดตามบุคคล ใช้โหมดนี้เมื่อใช้การตรวจจับท่าทางกับรูปภาพนิ่ง หรือในกรณีที่ไม่ต้องการการติดตาม

การกำหนดค่าฮาร์ดแวร์

PoseDetector รองรับการกำหนดค่าฮาร์ดแวร์หลายรายการเพื่อเพิ่มประสิทธิภาพ ดังนี้

CPU: เรียกใช้เครื่องตรวจจับโดยใช้ CPU เท่านั้น
CPU_GPU: เรียกใช้เครื่องตรวจจับโดยใช้ทั้ง CPU และ GPU

เมื่อสร้างตัวเลือกเครื่องตรวจจับ คุณสามารถใช้ API setPreferredHardwareConfigs เพื่อควบคุมการเลือกฮาร์ดแวร์ โดยค่าเริ่มต้น ระบบจะตั้งค่าการกำหนดค่าฮาร์ดแวร์ทั้งหมดเป็นค่าที่ต้องการ

ML Kit จะพิจารณาความพร้อมใช้งาน ความเสถียร ความถูกต้อง และเวลาในการตอบสนองของการกำหนดค่าแต่ละรายการ แล้วเลือกการกำหนดค่าที่ดีที่สุดจากการกำหนดค่าที่ต้องการ หากไม่มีการกำหนดค่าที่ต้องการใดๆ ที่ใช้ได้ ระบบจะใช้การกำหนดค่า CPU เป็นค่าสำรองโดยอัตโนมัติ ML Kit จะทำการตรวจสอบและการเตรียมการที่เกี่ยวข้องในลักษณะที่ไม่บล็อกก่อนที่จะเปิดใช้การเร่งความเร็วใดๆ ดังนั้นจึงเป็นไปได้มากว่าเมื่อผู้ใช้เรียกใช้เครื่องตรวจจับเป็นครั้งแรก ระบบจะใช้ CPU หลังจากเตรียมการทั้งหมดเสร็จสิ้น ระบบจะใช้การกำหนดค่าที่ดีที่สุดในการเรียกใช้ครั้งต่อๆ ไป

ตัวอย่างการใช้งาน setPreferredHardwareConfigs

หากต้องการให้ ML Kit เลือกการกำหนดค่าที่ดีที่สุด ให้ไม่ต้องเรียก API นี้
หากไม่ต้องการเปิดใช้การเร่งความเร็วใดๆ ให้ส่งเฉพาะ CPU
หากต้องการใช้ GPU เพื่อลดภาระงานของ CPU แม้ว่า GPU อาจทำงานช้ากว่า ให้ส่ง เฉพาะ CPU_GPU

ระบุตัวเลือกเครื่องตรวจจับท่าทาง ดังนี้

Kotlin

// Base pose detector with streaming frames, when depending on the pose-detection sdk
val options = PoseDetectorOptions.Builder()
    .setDetectorMode(PoseDetectorOptions.STREAM_MODE)
    .build()

// Accurate pose detector on static images, when depending on the pose-detection-accurate sdk
val options = AccuratePoseDetectorOptions.Builder()
    .setDetectorMode(AccuratePoseDetectorOptions.SINGLE_IMAGE_MODE)
    .build()

Java

// Base pose detector with streaming frames, when depending on the pose-detection sdk
PoseDetectorOptions options =
   new PoseDetectorOptions.Builder()
       .setDetectorMode(PoseDetectorOptions.STREAM_MODE)
       .build();

// Accurate pose detector on static images, when depending on the pose-detection-accurate sdk
AccuratePoseDetectorOptions options =
   new AccuratePoseDetectorOptions.Builder()
       .setDetectorMode(AccuratePoseDetectorOptions.SINGLE_IMAGE_MODE)
       .build();

สุดท้าย ให้สร้างอินสแตนซ์ของ PoseDetector ส่งตัวเลือกที่คุณระบุ

Kotlin

val poseDetector = PoseDetection.getClient(options)

Java

PoseDetector poseDetector = PoseDetection.getClient(options);

2. เตรียมรูปภาพอินพุต

หากต้องการตรวจจับท่าทางในรูปภาพ ให้สร้างออบเจ็กต์ InputImage จาก Bitmap, media.Image, ByteBuffer, อาร์เรย์ไบต์ หรือไฟล์ในอุปกรณ์ จากนั้นส่งออบเจ็กต์ InputImage ไปยัง PoseDetector

สำหรับการตรวจจับท่าทาง คุณควรใช้รูปภาพที่มีขนาดอย่างน้อย 480x360 พิกเซล หากตรวจจับท่าทางในแอปพลิเคชันแบบเรียลไทม์ การจับภาพเฟรมที่ความละเอียดต่ำสุดนี้จะช่วยลดเวลาในการตอบสนองได้

คุณสามารถสร้างInputImage ออบเจ็กต์จากแหล่งที่มาต่างๆ ซึ่งอธิบายไว้ด้านล่าง

การใช้ `media.Image`

หากต้องการสร้างออบเจ็กต์ InputImage จากออบเจ็กต์ media.Image เช่น เมื่อคุณจับภาพจากกล้องของอุปกรณ์ ให้ส่งออบเจ็กต์ media.Image และการหมุนของรูปภาพไปยัง InputImage.fromMediaImage()

หากคุณใช้ไลบรารี CameraX คลาส OnImageCapturedListener และ ImageAnalysis.Analyzer จะคำนวณค่าการหมุน ให้คุณ

Kotlin

private class YourImageAnalyzer : ImageAnalysis.Analyzer {

    override fun analyze(imageProxy: ImageProxy) {
        val mediaImage = imageProxy.image
        if (mediaImage != null) {
            val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees)
            // Pass image to an ML Kit Vision API
            // ...
        }
    }
}

Java

private class YourAnalyzer implements ImageAnalysis.Analyzer {

    @Override
    public void analyze(ImageProxy imageProxy) {
        Image mediaImage = imageProxy.getImage();
        if (mediaImage != null) {
          InputImage image =
                InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees());
          // Pass image to an ML Kit Vision API
          // ...
        }
    }
}

หากคุณไม่ได้ใช้ไลบรารีกล้องที่ให้องศาการหมุนของรูปภาพ คุณ สามารถคำนวณองศาการหมุนจากองศาการหมุนของอุปกรณ์และการวางแนวของเซ็นเซอร์กล้องในอุปกรณ์ได้ดังนี้

Kotlin

private val ORIENTATIONS = SparseIntArray()

init {
    ORIENTATIONS.append(Surface.ROTATION_0, 0)
    ORIENTATIONS.append(Surface.ROTATION_90, 90)
    ORIENTATIONS.append(Surface.ROTATION_180, 180)
    ORIENTATIONS.append(Surface.ROTATION_270, 270)
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
@Throws(CameraAccessException::class)
private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    val deviceRotation = activity.windowManager.defaultDisplay.rotation
    var rotationCompensation = ORIENTATIONS.get(deviceRotation)

    // Get the device's sensor orientation.
    val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager
    val sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION)!!

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360
    }
    return rotationCompensation
}MLKitVisionImage.kt

Java

private static final SparseIntArray ORIENTATIONS = new SparseIntArray();
static {
    ORIENTATIONS.append(Surface.ROTATION_0, 0);
    ORIENTATIONS.append(Surface.ROTATION_90, 90);
    ORIENTATIONS.append(Surface.ROTATION_180, 180);
    ORIENTATIONS.append(Surface.ROTATION_270, 270);
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing)
        throws CameraAccessException {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation();
    int rotationCompensation = ORIENTATIONS.get(deviceRotation);

    // Get the device's sensor orientation.
    CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE);
    int sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION);

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360;
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360;
    }
    return rotationCompensation;
}

จากนั้นส่งออบเจ็กต์ media.Image และค่าองศาการหมุนไปยัง InputImage.fromMediaImage()

Kotlin

val image = InputImage.fromMediaImage(mediaImage, rotation)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromMediaImage(mediaImage, rotation);

การใช้ URI ของไฟล์

หากต้องการสร้างออบเจ็กต์ InputImage จาก URI ของไฟล์ ให้ส่งบริบทของแอปและ URI ของไฟล์ไปยัง InputImage.fromFilePath() วิธีนี้มีประโยชน์เมื่อคุณ ใช้ Intent ACTION_GET_CONTENT เพื่อแจ้งให้ผู้ใช้เลือก รูปภาพจากแอปแกลเลอรี

Kotlin

val image: InputImage
try {
    image = InputImage.fromFilePath(context, uri)
} catch (e: IOException) {
    e.printStackTrace()
}MLKitVisionImage.kt

Java

InputImage image;
try {
    image = InputImage.fromFilePath(context, uri);
} catch (IOException e) {
    e.printStackTrace();
}

การใช้ `ByteBuffer` หรือ `ByteArray`

หากต้องการสร้างออบเจ็กต์ InputImage จาก ByteBuffer หรือ ByteArray ให้คำนวณองศาการหมุนของรูปภาพ ก่อนตามที่อธิบายไว้ก่อนหน้านี้สำหรับอินพุต media.Image จากนั้นสร้างออบเจ็กต์ InputImage ด้วยบัฟเฟอร์หรืออาร์เรย์ รวมถึงความสูง ความกว้าง รูปแบบการเข้ารหัสสี และองศาการหมุนของรูปภาพ ดังนี้

Kotlin

val image = InputImage.fromByteBuffer(
        byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)MLKitVisionImage.kt
// Or:
val image = InputImage.fromByteArray(
        byteArray,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)
MLKitVisionImage.kt

Java

InputImage image = InputImage.fromByteBuffer(byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java
// Or:
InputImage image = InputImage.fromByteArray(
        byteArray,
        /* image width */480,
        /* image height */360,
        rotation,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java

การใช้ `Bitmap`

หากต้องการสร้างออบเจ็กต์ InputImage จากออบเจ็กต์ Bitmap ให้ประกาศดังนี้

Kotlin

val image = InputImage.fromBitmap(bitmap, 0)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);MLKitVisionImage.java

รูปภาพจะแสดงด้วยออบเจ็กต์ Bitmap พร้อมกับองศาการหมุน

3. ประมวลผลรูปภาพ

ส่งออบเจ็กต์ InputImage ที่เตรียมไว้ไปยังเมธอด process ของ PoseDetector

Kotlin

Task<Pose> result = poseDetector.process(image)
       .addOnSuccessListener { results ->
           // Task completed successfully
           // ...
       }
       .addOnFailureListener { e ->
           // Task failed with an exception
           // ...
       }

Java

Task<Pose> result =
        poseDetector.process(image)
                .addOnSuccessListener(
                        new OnSuccessListener<Pose>() {
                            @Override
                            public void onSuccess(Pose pose) {
                                // Task completed successfully
                                // ...
                            }
                        })
                .addOnFailureListener(
                        new OnFailureListener() {
                            @Override
                            public void onFailure(@NonNull Exception e) {
                                // Task failed with an exception
                                // ...
                            }
                        });

หมายเหตุ: หากคุณใช้ CameraX API โปรดปิด ImageProxy เมื่อใช้เสร็จแล้ว เช่น โดยการเพิ่ม OnCompleteListener ลงใน Task ที่แสดงจาก process เมธอด ดูคลาส VisionProcessorBase ในแอปตัวอย่างเริ่มต้นใช้งานฉบับย่อ

4. ดูข้อมูลเกี่ยวกับท่าทางที่ตรวจพบ

หากตรวจพบบุคคลในรูปภาพ API การตรวจจับท่าทางจะแสดงPoseออบเจ็กต์ที่มี 33 PoseLandmark

หากบุคคลไม่ได้อยู่ในรูปภาพทั้งหมด โมเดลจะกำหนดพิกัดของแลนด์มาร์กที่ขาดหายไปนอกเฟรมและกำหนดค่า InFrameConfidence ต่ำ

หากไม่พบบุคคลในเฟรม Pose object จะไม่มี PoseLandmarks

Kotlin

// Get all PoseLandmarks. If no person was detected, the list will be empty
val allPoseLandmarks = pose.getAllPoseLandmarks()

// Or get specific PoseLandmarks individually. These will all be null if no person
// was detected
val leftShoulder = pose.getPoseLandmark(PoseLandmark.LEFT_SHOULDER)
val rightShoulder = pose.getPoseLandmark(PoseLandmark.RIGHT_SHOULDER)
val leftElbow = pose.getPoseLandmark(PoseLandmark.LEFT_ELBOW)
val rightElbow = pose.getPoseLandmark(PoseLandmark.RIGHT_ELBOW)
val leftWrist = pose.getPoseLandmark(PoseLandmark.LEFT_WRIST)
val rightWrist = pose.getPoseLandmark(PoseLandmark.RIGHT_WRIST)
val leftHip = pose.getPoseLandmark(PoseLandmark.LEFT_HIP)
val rightHip = pose.getPoseLandmark(PoseLandmark.RIGHT_HIP)
val leftKnee = pose.getPoseLandmark(PoseLandmark.LEFT_KNEE)
val rightKnee = pose.getPoseLandmark(PoseLandmark.RIGHT_KNEE)
val leftAnkle = pose.getPoseLandmark(PoseLandmark.LEFT_ANKLE)
val rightAnkle = pose.getPoseLandmark(PoseLandmark.RIGHT_ANKLE)
val leftPinky = pose.getPoseLandmark(PoseLandmark.LEFT_PINKY)
val rightPinky = pose.getPoseLandmark(PoseLandmark.RIGHT_PINKY)
val leftIndex = pose.getPoseLandmark(PoseLandmark.LEFT_INDEX)
val rightIndex = pose.getPoseLandmark(PoseLandmark.RIGHT_INDEX)
val leftThumb = pose.getPoseLandmark(PoseLandmark.LEFT_THUMB)
val rightThumb = pose.getPoseLandmark(PoseLandmark.RIGHT_THUMB)
val leftHeel = pose.getPoseLandmark(PoseLandmark.LEFT_HEEL)
val rightHeel = pose.getPoseLandmark(PoseLandmark.RIGHT_HEEL)
val leftFootIndex = pose.getPoseLandmark(PoseLandmark.LEFT_FOOT_INDEX)
val rightFootIndex = pose.getPoseLandmark(PoseLandmark.RIGHT_FOOT_INDEX)
val nose = pose.getPoseLandmark(PoseLandmark.NOSE)
val leftEyeInner = pose.getPoseLandmark(PoseLandmark.LEFT_EYE_INNER)
val leftEye = pose.getPoseLandmark(PoseLandmark.LEFT_EYE)
val leftEyeOuter = pose.getPoseLandmark(PoseLandmark.LEFT_EYE_OUTER)
val rightEyeInner = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE_INNER)
val rightEye = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE)
val rightEyeOuter = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE_OUTER)
val leftEar = pose.getPoseLandmark(PoseLandmark.LEFT_EAR)
val rightEar = pose.getPoseLandmark(PoseLandmark.RIGHT_EAR)
val leftMouth = pose.getPoseLandmark(PoseLandmark.LEFT_MOUTH)
val rightMouth = pose.getPoseLandmark(PoseLandmark.RIGHT_MOUTH)

Java

// Get all PoseLandmarks. If no person was detected, the list will be empty
List<PoseLandmark> allPoseLandmarks = pose.getAllPoseLandmarks();

// Or get specific PoseLandmarks individually. These will all be null if no person
// was detected
PoseLandmark leftShoulder = pose.getPoseLandmark(PoseLandmark.LEFT_SHOULDER);
PoseLandmark rightShoulder = pose.getPoseLandmark(PoseLandmark.RIGHT_SHOULDER);
PoseLandmark leftElbow = pose.getPoseLandmark(PoseLandmark.LEFT_ELBOW);
PoseLandmark rightElbow = pose.getPoseLandmark(PoseLandmark.RIGHT_ELBOW);
PoseLandmark leftWrist = pose.getPoseLandmark(PoseLandmark.LEFT_WRIST);
PoseLandmark rightWrist = pose.getPoseLandmark(PoseLandmark.RIGHT_WRIST);
PoseLandmark leftHip = pose.getPoseLandmark(PoseLandmark.LEFT_HIP);
PoseLandmark rightHip = pose.getPoseLandmark(PoseLandmark.RIGHT_HIP);
PoseLandmark leftKnee = pose.getPoseLandmark(PoseLandmark.LEFT_KNEE);
PoseLandmark rightKnee = pose.getPoseLandmark(PoseLandmark.RIGHT_KNEE);
PoseLandmark leftAnkle = pose.getPoseLandmark(PoseLandmark.LEFT_ANKLE);
PoseLandmark rightAnkle = pose.getPoseLandmark(PoseLandmark.RIGHT_ANKLE);
PoseLandmark leftPinky = pose.getPoseLandmark(PoseLandmark.LEFT_PINKY);
PoseLandmark rightPinky = pose.getPoseLandmark(PoseLandmark.RIGHT_PINKY);
PoseLandmark leftIndex = pose.getPoseLandmark(PoseLandmark.LEFT_INDEX);
PoseLandmark rightIndex = pose.getPoseLandmark(PoseLandmark.RIGHT_INDEX);
PoseLandmark leftThumb = pose.getPoseLandmark(PoseLandmark.LEFT_THUMB);
PoseLandmark rightThumb = pose.getPoseLandmark(PoseLandmark.RIGHT_THUMB);
PoseLandmark leftHeel = pose.getPoseLandmark(PoseLandmark.LEFT_HEEL);
PoseLandmark rightHeel = pose.getPoseLandmark(PoseLandmark.RIGHT_HEEL);
PoseLandmark leftFootIndex = pose.getPoseLandmark(PoseLandmark.LEFT_FOOT_INDEX);
PoseLandmark rightFootIndex = pose.getPoseLandmark(PoseLandmark.RIGHT_FOOT_INDEX);
PoseLandmark nose = pose.getPoseLandmark(PoseLandmark.NOSE);
PoseLandmark leftEyeInner = pose.getPoseLandmark(PoseLandmark.LEFT_EYE_INNER);
PoseLandmark leftEye = pose.getPoseLandmark(PoseLandmark.LEFT_EYE);
PoseLandmark leftEyeOuter = pose.getPoseLandmark(PoseLandmark.LEFT_EYE_OUTER);
PoseLandmark rightEyeInner = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE_INNER);
PoseLandmark rightEye = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE);
PoseLandmark rightEyeOuter = pose.getPoseLandmark(PoseLandmark.RIGHT_EYE_OUTER);
PoseLandmark leftEar = pose.getPoseLandmark(PoseLandmark.LEFT_EAR);
PoseLandmark rightEar = pose.getPoseLandmark(PoseLandmark.RIGHT_EAR);
PoseLandmark leftMouth = pose.getPoseLandmark(PoseLandmark.LEFT_MOUTH);
PoseLandmark rightMouth = pose.getPoseLandmark(PoseLandmark.RIGHT_MOUTH);

เคล็ดลับในการปรับปรุงประสิทธิภาพ

คุณภาพของผลลัพธ์ขึ้นอยู่กับคุณภาพของรูปภาพอินพุต ดังนี้

ML Kit จะตรวจจับท่าทางได้อย่างแม่นยำ หากรูปภาพมีข้อมูลพิกเซลเพียงพอที่แสดงถึงบุคคลนั้น และเพื่อให้ได้ประสิทธิภาพที่ดีที่สุด รูปภาพควรมีขนาดอย่างน้อย 256x256 พิกเซล
หากคุณตรวจจับท่าทางในแอปพลิเคชันแบบเรียลไทม์ คุณอาจต้องพิจารณาขนาดโดยรวมของรูปภาพอินพุตด้วย รูปภาพขนาดเล็กจะประมวลผลได้เร็วกว่า ดังนั้นหากต้องการลดเวลาในการตอบสนอง ให้จับภาพที่ความละเอียดต่ำลง แต่โปรดคำนึงถึงข้อกำหนดด้านความละเอียดข้างต้นและตรวจสอบว่ารูปภาพมีขนาดเพียงพอสำหรับแสดงบุคคลนั้น
การโฟกัสรูปภาพไม่ดีก็อาจส่งผลต่อความแม่นยำได้เช่นกัน หากผลลัพธ์ไม่เป็นที่ยอมรับ ให้ขอให้ผู้ใช้จับภาพอีกครั้ง

หากต้องการใช้การตรวจจับท่าทางในแอปพลิเคชันแบบเรียลไทม์ ให้ทำตามหลักเกณฑ์ต่อไปนี้เพื่อให้ได้อัตราเฟรมที่ดีที่สุด

ใช้ SDK การตรวจจับท่าทางพื้นฐานและ STREAM_MODE
พิจารณาจับภาพที่ความละเอียดต่ำลง อย่างไรก็ตาม โปรดคำนึงถึงข้อกำหนดด้านขนาดรูปภาพของ API นี้ด้วย
หากคุณใช้ Camera หรือ camera2 API ให้ควบคุมการเรียกเครื่องตรวจจับ หากมีเฟรมวิดีโอใหม่ ขณะที่เครื่องตรวจจับกำลังทำงาน ให้ทิ้งเฟรมนั้น ดูคลาส VisionProcessorBase ในแอปตัวอย่างเริ่มต้นใช้งานฉบับย่อ
หากคุณใช้ CameraX API โปรดตรวจสอบว่าได้ตั้งค่ากลยุทธ์การควบคุมปริมาณข้อมูลที่ส่งไปยังเครื่องวิเคราะห์เป็นค่าเริ่มต้น ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST ซึ่งจะรับประกันว่าระบบจะส่งรูปภาพเพียงรูปเดียวสำหรับการวิเคราะห์ในแต่ละครั้ง หากมีการสร้างรูปภาพเพิ่มเติมเมื่อเครื่องวิเคราะห์ทำงานอยู่ ระบบจะทิ้งรูปภาพเหล่านั้นโดยอัตโนมัติและจะไม่จัดคิวเพื่อส่ง เมื่อปิดรูปภาพที่กำลังวิเคราะห์โดยการเรียก ImageProxy.close() ระบบจะส่งรูปภาพล่าสุดถัดไป
หากคุณใช้เอาต์พุตของเครื่องตรวจจับเพื่อวางซ้อนกราฟิกบน รูปภาพอินพุต ให้รับผลลัพธ์จาก ML Kit ก่อน จากนั้นแสดงรูปภาพ และวางซ้อนในขั้นตอนเดียว ซึ่งจะแสดงผลไปยังพื้นผิวการแสดงผล เพียงครั้งเดียวสำหรับเฟรมอินพุตแต่ละเฟรม ดูคลาส CameraSourcePreview และ GraphicOverlay ในแอปตัวอย่างเริ่มต้นใช้งานฉบับย่อ
หากคุณใช้ Camera2 API ให้จับภาพใน ImageFormat.YUV_420_888 รูปแบบ หากคุณใช้ Camera API เวอร์ชันเก่า ให้จับภาพใน ImageFormat.NV21 รูปแบบ

ขั้นตอนถัดไป

ดูวิธีใช้แลนด์มาร์กท่าทางเพื่อจัดประเภทท่าทางได้ที่เคล็ดลับการจัดประเภทท่าทาง

ลองเลย

ก่อนเริ่มต้น

1. สร้างอินสแตนซ์ของ PoseDetector

ตัวเลือก PoseDetector

โหมดการตรวจจับ

การกำหนดค่าฮาร์ดแวร์

Kotlin

Java

Kotlin

Java

2. เตรียมรูปภาพอินพุต

การใช้ media.Image

Kotlin

Java

Kotlin

Java

Kotlin

Java

การใช้ URI ของไฟล์

Kotlin

Java

การใช้ ByteBuffer หรือ ByteArray

Kotlin

Java

การใช้ Bitmap

Kotlin

Java

3. ประมวลผลรูปภาพ

Kotlin

Java

4. ดูข้อมูลเกี่ยวกับท่าทางที่ตรวจพบ

Kotlin

Java

เคล็ดลับในการปรับปรุงประสิทธิภาพ

ขั้นตอนถัดไป

1. สร้างอินสแตนซ์ของ `PoseDetector`

ตัวเลือก `PoseDetector`

การใช้ `media.Image`

การใช้ `ByteBuffer` หรือ `ByteArray`

การใช้ `Bitmap`