অ্যান্ড্রয়েডে এমএল কিট সহ ডকুমেন্ট স্ক্যানার
আপনার অ্যাপে সহজেই একটি ডকুমেন্ট স্ক্যানার বৈশিষ্ট্য যুক্ত করতে ML Kit ডকুমেন্ট স্ক্যানার API ব্যবহার করুন।
| বৈশিষ্ট্য | বিস্তারিত |
|---|---|
| Sdk নাম | প্লে-সার্ভিসেস-এমএলকিট-ডকুমেন্ট-স্ক্যানার |
| বাস্তবায়ন | মডেল, স্ক্যানিং লজিক এবং UI ফ্লো গুগল প্লে পরিষেবা দ্বারা গতিশীলভাবে ডাউনলোড করা হয়। |
| অ্যাপের আকারের প্রভাব | ~৩০০KB ডাউনলোডের আকার বৃদ্ধি। |
| আরম্ভের সময় | প্রথমবার ব্যবহারের আগে ব্যবহারকারীদের মডেল, লজিক এবং UI ফ্লো ডাউনলোড হওয়া পর্যন্ত অপেক্ষা করতে হতে পারে। |
চেষ্টা করে দেখো
এই API এর একটি উদাহরণ ব্যবহারের জন্য নমুনা অ্যাপটি ব্যবহার করুন।
শুরু করার আগে
আপনার প্রজেক্ট-লেভেল
build.gradleফাইলে, আপনার buildscript এবং allprojects উভয় বিভাগেই Google এর Maven রিপোজিটরি অন্তর্ভুক্ত করতে ভুলবেন না।আপনার মডিউলের অ্যাপ-লেভেল গ্রেডল ফাইলে ML কিট ডকুমেন্ট স্ক্যানার লাইব্রেরির জন্য নির্ভরতা যোগ করুন, যা সাধারণত app/build.gradle হয়:
dependencies {
// …
implementation 'com.google.android.gms:play-services-mlkit-document-scanner:16.0.0'
}
ডকুমেন্ট স্ক্যানার কনফিগারেশন
ডকুমেন্ট স্ক্যানার ব্যবহারকারী প্রবাহ (যার মধ্যে একটি ডেডিকেটেড ভিউফাইন্ডার স্ক্রিন এবং প্রিভিউ স্ক্রিন অন্তর্ভুক্ত) SDK দ্বারা সরবরাহ করা হয়। ভিউফাইন্ডার এবং প্রিভিউ স্ক্রিন নিম্নলিখিত কাস্টমাইজযোগ্য নিয়ন্ত্রণগুলিকে সমর্থন করে:
- ফটো গ্যালারি থেকে আমদানি করা হচ্ছে
- স্ক্যান করা পৃষ্ঠার সংখ্যার সীমা নির্ধারণ করা
- স্ক্যানার মোড (প্রবাহে বৈশিষ্ট্য সেট নিয়ন্ত্রণ করতে)
আপনি আপনার স্ক্যান করা নথির জন্য PDF এবং JPEG উভয় ফাইলই পুনরুদ্ধার করতে পারেন।
স্ক্যানার অপশন কনফিগার করতে GmsDocumentScannerOptions ইন্সট্যান্ট করুন:
কোটলিন
val options = GmsDocumentScannerOptions.Builder()
.setGalleryImportAllowed(false)
.setPageLimit(2)
.setResultFormats(RESULT_FORMAT_JPEG, RESULT_FORMAT_PDF)
.setScannerMode(SCANNER_MODE_FULL)
.build()জাভা
GmsDocumentScannerOptions options = new GmsDocumentScannerOptions.Builder()
.setGalleryImportAllowed(false)
.setPageLimit(2)
.setResultFormats(RESULT_FORMAT_JPEG, RESULT_FORMAT_PDF)
.setScannerMode(SCANNER_MODE_FULL)
.build();ডকুমেন্ট স্ক্যান করুন
আপনার GmsDocumentScannerOptions তৈরি করার পরে, GmsDocumentScanner এর একটি উদাহরণ পান। এরপর আপনি AndroidX-এ প্রবর্তিত Activity Result API গুলি অনুসরণ করে স্ক্যানার কার্যকলাপ শুরু করতে পারেন।
ডকুমেন্ট স্ক্যানিং সম্পন্ন হলে, একটি GmsDocumentScanningResult অবজেক্ট setResultFormats এর মাধ্যমে সংজ্ঞায়িত পৃষ্ঠাগুলির সংখ্যা, JPEG ফর্ম্যাটে চিত্রগুলির URI এবং PDF অ্যাক্সেস দেবে:
কোটলিন
val scanner = GmsDocumentScanning.getClient(options) val scannerLauncher = registerForActivityResult(StartIntentSenderForResult()) { result -> { if (result.resultCode == RESULT_OK) { val result = GmsDocumentScanningResult.fromActivityResultIntent(result.data) result.getPages()?.let { pages -> for (page in pages) { val imageUri = pages.get(0).getImageUri() } } result.getPdf()?.let { pdf -> val pdfUri = pdf.getUri() val pageCount = pdf.getPageCount() } } } } scanner.getStartScanIntent(activity) .addOnSuccessListener { intentSender -> scannerLauncher.launch(IntentSenderRequest.Builder(intentSender).build()) } .addOnFailureListener { ... }
জাভা
GmsDocumentScanner scanner = GmsDocumentScanning.getClient(options); ActivityResultLauncher<IntentSenderRequest> scannerLauncher = registerForActivityResult( new StartIntentSenderForResult(), result -> { if (result.getResultCode() == RESULT_OK) { GmsDocumentScanningResult result = GmsDocumentScanningResult.fromActivityResultIntent(result.getData()); for (Page page : result.getPages()) { Uri imageUri = pages.get(0).getImageUri(); } Pdf pdf = result.getPdf(); Uri pdfUri = pdf.getUri(); int pageCount = pdf.getPageCount(); } }); scanner.getStartScanIntent(activity) .addOnSuccessListener(intentSender -> scannerLauncher.launch(new IntentSenderRequest.Builder(intentSender).build())) .addOnFailureListener(...);
কর্মক্ষমতা উন্নত করার টিপস
মনে রাখবেন যে ডকুমেন্ট ফাইল তৈরি করতে সময় লাগে এবং প্রক্রিয়াকরণ ক্ষমতার প্রয়োজন হয়, তাই শুধুমাত্র আপনার প্রয়োজনীয় আউটপুট ফর্ম্যাটগুলি (JPEG, অথবা PDF, অথবা উভয়) অনুরোধ করুন।
অন্য কিছু উল্লেখ না করা থাকলে, এই পৃষ্ঠার কন্টেন্ট Creative Commons Attribution 4.0 License-এর অধীনে এবং কোডের নমুনাগুলি Apache 2.0 License-এর অধীনে লাইসেন্স প্রাপ্ত। আরও জানতে, Google Developers সাইট নীতি দেখুন। Java হল Oracle এবং/অথবা তার অ্যাফিলিয়েট সংস্থার রেজিস্টার্ড ট্রেডমার্ক।
2025-10-29 UTC-তে শেষবার আপডেট করা হয়েছে।