Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
L'API de segmentation du sujet de ML Kit permet aux développeurs de séparer facilement plusieurs sujets de l'arrière-plan d'une image, ce qui permet des cas d'utilisation tels que la création d'autocollants, le changement d'arrière-plan ou l'ajout d'effets sympas à des sujets.
Les sujets sont les personnes, les animaux ou les objets les plus importants qui se trouvent au premier plan de l'image. Si deux sujets sont très proches ou se touchent, ils sont considérés comme un seul sujet.
L'API de segmentation du sujet prend une image d'entrée et génère un masque ou un bitmap de sortie pour le premier plan. Il fournit également un masque et un bitmap pour chacun des sujets détectés (le premier plan est égal à tous les sujets combinés).
Par défaut, le masque et le bitmap de premier plan ont la même taille que l'image d'entrée (la taille du masque et du bitmap de chaque sujet sera probablement différente de celle de l'image d'entrée). Chaque pixel du masque se voit attribuer un nombre flottant dont la plage est comprise entre 0.0 et 1.0. Plus le nombre est proche de 1.0, plus l'indice de confiance que le pixel représente un sujet est élevé, et inversement.
En moyenne, la latence mesurée sur le Pixel 7 Pro est d'environ 200 ms. Cette API n'est actuellement compatible qu'avec les images statiques.
Segmentation multisujets:fournit des masques et des bitmaps pour chaque sujet individuel, au lieu d'un seul masque et bitmap pour tous les sujets combinés.
Reconnaissance de sujet:les sujets reconnus sont des objets, des animaux de compagnie et des humains.
Traitement sur l'appareil:tous les traitements sont effectués sur l'appareil, ce qui préserve la confidentialité des utilisateurs et ne nécessite aucune connectivité réseau.
Exemples de résultats
Image d'entrée
Image + Masque de sortie
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/25 (UTC).
[null,null,["Dernière mise à jour le 2025/07/25 (UTC)."],[[["\u003cp\u003eThe ML Kit subject segmentation API enables developers to isolate subjects (people, pets, objects) from the background in images for various applications like sticker creation and background replacement.\u003c/p\u003e\n"],["\u003cp\u003eThis API provides individual masks and bitmaps for each detected subject, allowing for granular manipulation and effects.\u003c/p\u003e\n"],["\u003cp\u003eAll processing happens on-device, ensuring user privacy and eliminating the need for internet connectivity.\u003c/p\u003e\n"],["\u003cp\u003eThis API is currently in beta and might undergo changes that could affect backward compatibility.\u003c/p\u003e\n"]]],[],null,["# Subject Segmentation\n\n| This API is offered in beta, and is not subject to any SLA or deprecation policy. Changes may be made to this API that break backward compatibility.\n\nML Kit's subject segmentation API allows developers to easily separate multiple\nsubjects from the background in a picture, enabling use cases such as sticker\ncreation, background swap, or adding cool effects to subjects.\n\nSubjects are defined as the most prominent people, pets, or objects in the\nforeground of the image. If 2 subjects are very close or touching each other,\nthey are considered a single subject.\n\nThe subject segmentation API takes an input image and generates an output mask\nor bitmap for the foreground. It also provides a mask and bitmap for each one of\nthe subjects detected (the foreground is equal to all subjects combined).\n\nBy default, the foreground mask and foreground bitmap are the same size as the\ninput image (the size of each individual subject's mask and bitmap will likely\ndiffer from input image size). Each pixel of the mask is assigned a float number\nthat has a range between `0.0` and `1.0`. The closer the number is to `1.0`, the\nhigher the confidence that the pixel represents a subject, and vice versa.\n\nOn average the latency measured on Pixel 7 Pro is around 200 ms. This API\ncurrently only supports static images.\n\n[Android](/ml-kit/vision/subject-segmentation/android)\n\n### Key capabilities\n\n- **Multi-subject segmentation:** provides masks and bitmaps for each individual subject, rather than a single mask and bitmap for all subjects combined.\n- **Subject recognition:** subjects recognized are objects, pets, and humans.\n- **On-device processing:** all processing is performed on the device, preserving user privacy and requiring no network connectivity.\n\n### Example results\n\n| Input Image | Output Image + Mask |\n|-------------|---------------------|\n| | |\n| | |\n| | |"]]