Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Escáner de documentos
La digitalización de documentos físicos, que permite a los usuarios convertir documentos físicos a formatos digitales, se ha convertido en un recorrido del usuario muy común en las apps para dispositivos móviles.
La API de escáner de documentos de ML Kit proporciona una solución integral con un
flujo de IU coherente y de alta calidad en apps y dispositivos para Android. Una vez que se activa el flujo del escáner de documentos desde tu app, los usuarios mantienen el control total del proceso de análisis. De manera opcional, pueden recortar los documentos escaneados, aplicar filtros, quitar sombras o manchas, y enviar los archivos digitalizados fácilmente a tu app.
El flujo de la IU, los modelos de AA y otros recursos grandes se entregan mediante los Servicios de Google Play, lo que significa lo siguiente:
El impacto bajo el tamaño del objeto binario (todos los modelos de AA y los recursos grandes se descargan de forma centralizada en los Servicios de Google Play).
No se requiere permiso para acceder a la cámara. El escáner de documentos aprovecha el permiso para acceder a la cámara de los Servicios de Google Play, y los usuarios controlan qué archivos compartir con tu app.
Todo el flujo del escáner de documentos funciona en el dispositivo.
Interfaz de usuario coherente y de alta calidad para digitalizar documentos físicos.
Captura automática con detección de documentos.
Detección precisa de bordes para obtener resultados de recorte óptimos.
Detección automática de rotación para mostrar los documentos en posición vertical.
Funciones de edición para recortar, aplicar filtros, quitar sombras, limpiar manchas y enviar archivos digitalizados sin problemas a tu app.
Procesamiento integrado en el dispositivo, lo que preserva la privacidad del usuario
No se necesita permiso de acceso a la cámara desde tu app.
Bajo impacto del tamaño del objeto binario del APK
Personalización
La API de escáner de documentos proporciona un flujo de IU completo y de alta calidad que es
coherente en todas las apps para Android. Sin embargo, también se pueden personalizar algunos aspectos de la experiencia del usuario:
Cantidad máxima de páginas:
Establece un límite para la cantidad de páginas analizadas.
Importación de galería:
Habilita o inhabilita la función para importar desde la galería de fotos.
Funciones de edición:
Elige entre 3 modos para personalizar las funciones de edición disponibles para el usuario:
SCANNER_MODE_BASE: Funciones de edición básicas (recortar, rotar, reordenar páginas, etcétera)
SCANNER_MODE_BASE_WITH_FILTER: Agrega filtros de imagen (escala de grises, mejora de imagen automática, etc.) al modo SCANNER_MODE_BASE.
SCANNER_MODE_FULL (predeterminado): Agrega funciones de limpieza de imágenes habilitadas con el AA (borrar manchas, dedos, etc.) al modo SCANNER_MODE_BASE_WITH_FILTER. Este modo también permitirá que se agreguen funciones importantes en el futuro de forma automática junto con las actualizaciones de los Servicios de Google Play, mientras que los otros dos modos mantendrán sus conjuntos de funciones actuales y solo recibirán mejoras menores.
Modo base
Modo base con filtro
Modo completo
Resultados de ejemplo
Imagen original
Documento escaneado con la perspectiva corregida, se quitaron las arrugas y se aplicó el filtro de escala de grises
Imagen original
El documento escaneado se rota automáticamente, se quita la mancha y se aplica el filtro de color
Imagen original
Documento escaneado sin manchas y con filtro automático aplicado
Imagen original
El documento escaneado se rota automáticamente, se quita la sombra y se aplica el filtro automático
Imagen original
El documento escaneado se rotó automáticamente; se quitó el dedo; y se aplicó el filtro automático
[null,null,["Última actualización: 2025-07-25 (UTC)"],[[["\u003cp\u003eML Kit's Document Scanner API enables digitization of physical documents within Android apps, providing a high-quality and consistent user interface.\u003c/p\u003e\n"],["\u003cp\u003eThe API offers on-device processing, ensuring user privacy and eliminating the need for camera permissions from the app.\u003c/p\u003e\n"],["\u003cp\u003eUsers have control over the scanning process, including cropping, applying filters, removing imperfections, and sharing the digitized files.\u003c/p\u003e\n"],["\u003cp\u003eCustomization options are available to tailor the user experience, such as limiting pages, enabling gallery imports, and adjusting editing functionalities.\u003c/p\u003e\n"],["\u003cp\u003eThe API leverages Google Play services for model delivery, minimizing app size and enabling automatic updates for enhanced features.\u003c/p\u003e\n"]]],["The document scanner API allows users to digitize physical documents within Android apps. Key actions include automatic document capture, edge and rotation detection, and editing features like cropping, filtering, and stain/shadow removal. The API operates on-device and uses Google Play services, ensuring low binary size impact and eliminating the need for camera permissions. Customization options are provided for the maximum number of pages, gallery import, and three editing modes, with the full mode offering the most feature set.\n"],null,["Document scanner\n----------------\n\n| This API is offered in beta, and is not subject to any SLA or deprecation policy. Changes may be made to this API that break backward compatibility.\n\nDigitizing physical documents, which allows users to convert physical documents\ninto digital formats has become a very common user journey in mobile apps.\nML Kit's document scanner API provides a comprehensive solution with a\nhigh-quality, consistent UI flow across Android apps and devices. Once the\ndocument scanner flow is triggered from your app, users retain full control over\nthe scanning process. They can optionally crop the scanned documents, apply\nfilters, remove shadows or stains, and easily send the digitized files back to\nyour app.\n\nThe UI flow, ML models and other large resources are delivered using Google Play\nservices, which means:\n\n- Low binary size impact (all ML models and large resources are downloaded centrally in Google Play services).\n- No camera permission is required - the document scanner leverages the Google Play services' camera permission, and users are in control of which files to share back with your app.\n\nThe entire document scanner flow operates on-device.\n\n[Android](/ml-kit/vision/doc-scanner/android)\n\n### Key capabilities\n\n- High-quality and consistent user interface for digitizing physical documents.\n- Automatic capture with document detection.\n- Accurate edge detection for optimal crop results.\n- Automatic rotation detection to show documents upright.\n- Editing functionalities to crop, apply filters, remove shadows, clean stains, and seamlessly send digitized files back to your app.\n- On-device processing, preserving user's privacy.\n- No camera permission is needed from your app.\n- Low apk binary size impact.\n\n### Customization\n\nThe document scanner API provides a high-quality fully fledged UI flow that is\nconsistent across Android apps. However, there is also room to customize some\naspects of the user experience:\n\n- **Maximum number of pages:** \n\n Set a limit to the number of pages scanned.\n\n- **Gallery import:** \n\n Enable or disable the capability to import from the photo gallery.\n\n- **Editing functionalities:** \n\n Customize the editing functionalities available to the user by choosing\n from 3 modes:\n\n - `SCANNER_MODE_BASE`: basic editing capabilities (crop, rotate, reorder pages, etc...).\n - `SCANNER_MODE_BASE_WITH_FILTER`: adds image filters (grayscale, auto image enhancement, etc...) to the `SCANNER_MODE_BASE` mode.\n - `SCANNER_MODE_FULL` (default): adds ML-enabled image cleaning capabilities (erase stains, fingers, etc...) to the `SCANNER_MODE_BASE_WITH_FILTER` mode. This mode will also allow future major features to be automatically added along with Google Play services updates, while the other two modes will maintain their current feature sets and only receive minor refinements.\n\n| Base mode | Base mode with filter | Full mode |\n|-----------|-----------------------|-----------|\n| | | |\n\n### Example results\n\n| Original picture | Scanned document with perspective corrected, wrinkle removed and grayscale filter applied |\n|------------------|-------------------------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with stain removed and color filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document with stain removed and auto filter applied |\n|------------------|-------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with shadow removed and auto filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |\n\n| Original picture | Scanned document auto-rotated with finger removed and auto filter applied |\n|------------------|---------------------------------------------------------------------------|\n| | |"]]