Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Scanner de documents
La numérisation de documents physiques, qui permet aux utilisateurs de convertir des documents physiques au format numérique, est devenue un parcours utilisateur très courant dans les applications mobiles.
L'API d'analyse de documents de ML Kit offre une solution complète avec un flux d'interface utilisateur cohérent et de haute qualité sur les applications et appareils Android. Une fois le flux du scanner de documents déclenché à partir de votre application, les utilisateurs conservent un contrôle total sur le processus de numérisation. Ils peuvent éventuellement recadrer les documents scannés, appliquer des filtres, supprimer les ombres ou les taches et renvoyer facilement les fichiers numérisés à votre application.
Le flux d'interface utilisateur, les modèles de ML et d'autres ressources volumineuses sont fournis à l'aide des services Google Play, ce qui signifie que:
Faible impact de taille binaire (tous les modèles de ML et toutes les ressources volumineuses sont téléchargés de manière centralisée dans les services Google Play).
Aucune autorisation d'accès à l'appareil photo n'est requise. Le scanner de documents exploite l'autorisation d'appareil photo des services Google Play, et les utilisateurs contrôlent les fichiers à partager avec votre application.
L'intégralité de la procédure de numérisation de documents s'effectue sur l'appareil.
Interface utilisateur cohérente et de haute qualité pour la numérisation de documents physiques.
Capture automatique avec détection de documents
Détection précise des bords pour un cadrage optimal.
Détection automatique de la rotation pour afficher les documents à l'endroit
Modification des fonctionnalités permettant de recadrer, d'appliquer des filtres, de supprimer les ombres, de nettoyer les tâches et de renvoyer facilement des fichiers numérisés à votre application.
Traitement sur l'appareil, protégeant la confidentialité de l'utilisateur.
Aucune autorisation d'accès à l'appareil photo n'est requise depuis votre appli.
Faible impact de la taille binaire de l'APK.
Fonctionnalités
L'API Document Scanner fournit un flux d'interface utilisateur à part entière de haute qualité et cohérent dans toutes les applications Android. Toutefois, il est également possible de personnaliser certains aspects de l'expérience utilisateur:
Nombre maximal de pages:
Définissez une limite du nombre de pages numérisées.
Importation de la galerie:
Activez ou désactivez l'importation depuis la galerie photo.
Fonctionnalités d'édition:
Personnalisez les fonctionnalités d'édition à la disposition de l'utilisateur en choisissant l'un des trois modes suivants:
SCANNER_MODE_BASE: fonctionnalités de modification de base (recadrage, rotation, réorganisation des pages, etc.).
SCANNER_MODE_BASE_WITH_FILTER: ajoute des filtres d'image (niveaux de gris, amélioration automatique de l'image, etc.) au mode SCANNER_MODE_BASE.
SCANNER_MODE_FULL (par défaut): ajoute des fonctionnalités de nettoyage d'images compatibles avec le ML (suppression des taches, des doigts, etc.) au mode SCANNER_MODE_BASE_WITH_FILTER. Ce mode permettra également d'ajouter automatiquement les futures fonctionnalités majeures avec les mises à jour des services Google Play, tandis que les deux autres modes conserveront leurs ensembles de fonctionnalités actuels et ne recevront que des améliorations mineures.
Mode Base
Mode de base avec filtre
Mode complet
Exemples de résultats
Photo d'origine
Document scanné avec la perspective corrigée, le pli supprimé et le filtre en nuances de gris appliqué
Photo d'origine
Le document numérisé a fait l'objet d'une rotation automatique avec une tache supprimée et un filtre de couleur appliqué.
Photo d'origine
Document scanné avec une tache supprimée et un filtre automatique appliqué
Photo d'origine
Le document numérisé a fait l'objet d'une rotation automatique avec une ombre supprimée et un filtre automatique appliqué.
Photo d'origine
Rotation automatique du document scanné sans le doigt et le filtre automatique est appliqué
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/25 (UTC).
[null,null,["Dernière mise à jour le 2025/07/25 (UTC)."],[[["\u003cp\u003eML Kit's Document Scanner API enables digitization of physical documents within Android apps, providing a high-quality and consistent user interface.\u003c/p\u003e\n"],["\u003cp\u003eThe API offers on-device processing, ensuring user privacy and eliminating the need for camera permissions from the app.\u003c/p\u003e\n"],["\u003cp\u003eUsers have control over the scanning process, including cropping, applying filters, removing imperfections, and sharing the digitized files.\u003c/p\u003e\n"],["\u003cp\u003eCustomization options are available to tailor the user experience, such as limiting pages, enabling gallery imports, and adjusting editing functionalities.\u003c/p\u003e\n"],["\u003cp\u003eThe API leverages Google Play services for model delivery, minimizing app size and enabling automatic updates for enhanced features.\u003c/p\u003e\n"]]],["The document scanner API allows users to digitize physical documents within Android apps. Key actions include automatic document capture, edge and rotation detection, and editing features like cropping, filtering, and stain/shadow removal. The API operates on-device and uses Google Play services, ensuring low binary size impact and eliminating the need for camera permissions. Customization options are provided for the maximum number of pages, gallery import, and three editing modes, with the full mode offering the most feature set.\n"],null,["Document scanner\n----------------\n\n| This API is offered in beta, and is not subject to any SLA or deprecation policy. Changes may be made to this API that break backward compatibility.\n\nDigitizing physical documents, which allows users to convert physical documents\ninto digital formats has become a very common user journey in mobile apps.\nML Kit's document scanner API provides a comprehensive solution with a\nhigh-quality, consistent UI flow across Android apps and devices. Once the\ndocument scanner flow is triggered from your app, users retain full control over\nthe scanning process. They can optionally crop the scanned documents, apply\nfilters, remove shadows or stains, and easily send the digitized files back to\nyour app.\n\nThe UI flow, ML models and other large resources are delivered using Google Play\nservices, which means:\n\n- Low binary size impact (all ML models and large resources are downloaded centrally in Google Play services).\n- No camera permission is required - the document scanner leverages the Google Play services' camera permission, and users are in control of which files to share back with your app.\n\nThe entire document scanner flow operates on-device.\n\n[Android](/ml-kit/vision/doc-scanner/android)\n\n### Key capabilities\n\n- High-quality and consistent user interface for digitizing physical documents.\n- Automatic capture with document detection.\n- Accurate edge detection for optimal crop results.\n- Automatic rotation detection to show documents upright.\n- Editing functionalities to crop, apply filters, remove shadows, clean stains, and seamlessly send digitized files back to your app.\n- On-device processing, preserving user's privacy.\n- No camera permission is needed from your app.\n- Low apk binary size impact.\n\n### Customization\n\nThe document scanner API provides a high-quality fully fledged UI flow that is\nconsistent across Android apps. However, there is also room to customize some\naspects of the user experience:\n\n- **Maximum number of pages:** \n\n Set a limit to the number of pages scanned.\n\n- **Gallery import:** \n\n Enable or disable the capability to import from the photo gallery.\n\n- **Editing functionalities:** \n\n Customize the editing functionalities available to the user by choosing\n from 3 modes:\n\n - `SCANNER_MODE_BASE`: basic editing capabilities (crop, rotate, reorder pages, etc...).\n - `SCANNER_MODE_BASE_WITH_FILTER`: adds image filters (grayscale, auto image enhancement, etc...) to the `SCANNER_MODE_BASE` mode.\n - `SCANNER_MODE_FULL` (default): adds ML-enabled image cleaning capabilities (erase stains, fingers, etc...) to the `SCANNER_MODE_BASE_WITH_FILTER` mode. This mode will also allow future major features to be automatically added along with Google Play services updates, while the other two modes will maintain their current feature sets and only receive minor refinements.\n\n| Base mode | Base mode with filter | Full mode |\n|-----------|-----------------------|-----------|\n| | | |\n\n### Example results\n\n| Original picture | Scanned document with perspective corrected, wrinkle removed and grayscale filter applied |\n|------------------|-------------------------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with stain removed and color filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document with stain removed and auto filter applied |\n|------------------|-------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with shadow removed and auto filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with finger removed and auto filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |"]]