এই পৃষ্ঠাটি Cloud Translation API অনুবাদ করেছে।

অ্যান্ড্রয়েডে একটি কাস্টম শ্রেণিবিন্যাস মডেলের সাথে বস্তুগুলি সনাক্ত করুন, ট্র্যাক করুন এবং শ্রেণীবদ্ধ করুন৷

আপনি এমএল কিট ব্যবহার করে পরপর ভিডিও ফ্রেমে বস্তু সনাক্ত ও ট্র্যাক করতে পারেন।

আপনি যখন এমএল কিট-এ কোনো ছবি পাঠান, তখন এটি ছবিটির মধ্যে থাকা পাঁচটি পর্যন্ত বস্তু এবং সেগুলোর প্রত্যেকটির অবস্থান শনাক্ত করে। ভিডিও স্ট্রিমে বস্তু শনাক্ত করার সময়, প্রতিটি বস্তুর একটি অনন্য আইডি থাকে, যা ব্যবহার করে আপনি ফ্রেম থেকে ফ্রেমে বস্তুটিকে ট্র্যাক করতে পারেন।

শনাক্ত করা বস্তুগুলোকে শ্রেণিবদ্ধ করতে আপনি একটি কাস্টম ইমেজ ক্লাসিফিকেশন মডেল ব্যবহার করতে পারেন। মডেলের সামঞ্জস্যতার প্রয়োজনীয়তা, প্রি-ট্রেইনড মডেল কোথায় পাবেন এবং কীভাবে আপনার নিজের মডেলকে ট্রেইন করবেন, সে সম্পর্কে নির্দেশনার জন্য এমএল কিট (ML Kit)-এর কাস্টম মডেল (Custom models with ML Kit ) অংশটি দেখুন।

একটি কাস্টম মডেল ইন্টিগ্রেট করার দুটি উপায় আছে। আপনি মডেলটিকে আপনার অ্যাপের অ্যাসেট ফোল্ডারে রেখে বান্ডল করতে পারেন, অথবা ক্লাউড স্টোরেজ থেকে ডাইনামিকভাবে ডাউনলোড করতে পারেন। নিচের সারণিতে এই দুটি বিকল্পের তুলনা করা হয়েছে।

বান্ডেল মডেল	হোস্টেড মডেল
মডেলটি আপনার অ্যাপের APK-এর একটি অংশ, যা এর আকার বাড়িয়ে দেয়।	মডেলটি আপনার APK-এর অংশ নয়। এটি ক্লাউড স্টোরেজে আপলোড করে হোস্ট করা হয়। আমরা Firebase-এর জন্য ক্লাউড স্টোরেজ ব্যবহার করার পরামর্শ দিই।
অ্যান্ড্রয়েড ডিভাইসটি অফলাইনে থাকলেও মডেলটি তাৎক্ষণিকভাবে পাওয়া যায়।	আপনার অ্যাপে চাহিদা অনুযায়ী মডেল ডাউনলোড করার কোড অবশ্যই অন্তর্ভুক্ত থাকতে হবে।
ফায়ারবেস প্রজেক্টের প্রয়োজন নেই	একটি Firebase প্রজেক্ট প্রয়োজন (যদি Cloud Storage for Firebase ব্যবহার করা হয়)।
মডেলটি আপডেট করতে আপনাকে অবশ্যই আপনার অ্যাপটি পুনরায় প্রকাশ করতে হবে।	আপনার অ্যাপ পুনরায় প্রকাশ না করেই মডেল আপডেটগুলি পাঠান।
অন্তর্নির্মিত A/B টেস্টিং নেই	ফায়ারবেস রিমোট কনফিগ ব্যবহার করে এ/বি টেস্টিং

চেষ্টা করে দেখুন

বান্ডলড মডেলের ব্যবহারের উদাহরণ দেখতে ভিশন কুইকস্টার্ট অ্যাপ এবং হোস্টেড মডেলের ব্যবহারের উদাহরণ দেখতে অটোএমএল কুইকস্টার্ট অ্যাপ দেখুন।
এই API-টির সম্পূর্ণ বাস্তবায়ন দেখতে ম্যাটেরিয়াল ডিজাইন শোকেস অ্যাপটি দেখুন।

শুরু করার আগে

আপনার প্রজেক্ট-স্তরের build.gradle.kts ফাইলে, buildscript এবং allprojects উভয় সেকশনেই গুগলের মেভেন রিপোজিটরি অন্তর্ভুক্ত করা নিশ্চিত করুন।

আপনার মডিউলের অ্যাপ-লেভেল গ্রেডল ফাইলে (যা সাধারণত app/build.gradle.kts হয়ে থাকে) এমএল কিট অ্যান্ড্রয়েড লাইব্রেরিগুলোর ডিপেন্ডেন্সি যোগ করুন।
আপনার অ্যাপের সাথে একটি মডেল যুক্ত করার জন্য:
```
dependencies {
  // ...
  // Object detection & tracking feature with custom bundled model
  implementation("com.google.mlkit:object-detection-custom:17.0.2")
}
```
আপনি যদি ক্লাউড স্টোরেজ ফর ফায়ারবেস থেকে কোনো মডেল ডাউনলোড করতে চান , তাহলে আপনার অ্যান্ড্রয়েড প্রজেক্টে ফায়ারবেস যোগ করে নিন , যদি আগে থেকে তা করা না থাকে। মডেলটি বান্ডল করার সময় এটি করার প্রয়োজন নেই।

১. মডেলটি লোড করুন

আপনি মডেলটি স্থানীয়ভাবে বান্ডেল করা উৎস থেকে অথবা দূরবর্তীভাবে হোস্ট করা উৎস থেকে লোড করতে পারেন।

একটি স্থানীয় মডেল উৎস কনফিগার করুন

আপনার অ্যাপের সাথে মডেলটি বান্ডল করতে:

মডেল ফাইলটি (সাধারণত যার শেষে .tflite বা .lite থাকে) আপনার অ্যাপের assets/ ফোল্ডারে কপি করুন। (এর জন্য আপনাকে প্রথমে app/ ফোল্ডারে রাইট-ক্লিক করে, তারপর New > Folder > Assets Folder-এ ক্লিক করে ফোল্ডারটি তৈরি করে নিতে হতে পারে।)
মডেল ফাইলের পাথ উল্লেখ করে একটি LocalModel অবজেক্ট তৈরি করুন:
কোটলিন
val localModel = LocalModel.Builder() .setAssetFilePath("model.tflite") // or .setAbsoluteFilePath(absolute path to model file) // or .setUri(URI to model file) .build()
জাভা
LocalModel localModel = new LocalModel.Builder() .setAssetFilePath("model.tflite") // or .setAbsoluteFilePath(absolute path to model file) // or .setUri(URI to model file) .build();
দ্রষ্টব্য: অ্যান্ড্রয়েড ১১-এর স্টোরেজ আপডেটের কারণে, অ্যান্ড্রয়েড ১১ (এপিআই লেভেল ৩০) টার্গেট করা অ্যাপগুলো এখন আর এক্সটার্নাল স্টোরেজ থেকে ফাইল অ্যাক্সেস করতে পারবে না।
দ্রষ্টব্য: যদি আপনার মডেলটি ফায়ারবেসে (গুগল ক্লাউডে নয়) অটোএমএল ভিশন এজ দিয়ে প্রশিক্ষিত হয়ে থাকে, তাহলে পূর্ববর্তী নির্দেশাবলী কাজ নাও করতে পারে। নির্দেশাবলীর জন্য মাইগ্রেশন গাইড অনুসরণ করুন।

দূরবর্তীভাবে হোস্ট করা মডেল উৎস কনফিগার করুন

রিমোটলি-হোস্টেড মডেল ব্যবহার করার জন্য, আপনাকে অবশ্যই আপনার নিজস্ব অ্যাপ লজিক ব্যবহার করে মডেল ফাইলটি ডিভাইসের লোকাল স্টোরেজে ডাউনলোড করতে হবে এবং তারপরে এটিকে একটি লোকাল মডেল হিসাবে লোড করতে হবে। আমরা একটি মডেল হোস্ট করার জন্য ক্লাউড স্টোরেজ ফর ফায়ারবেস (Cloud Storage for Firebase) ব্যবহার করার পরামর্শ দিই। বাস্তবায়নের বিস্তারিত তথ্যের জন্য, ফায়ারবেস এমএল টু ক্লাউড স্টোরেজ মাইগ্রেশন গাইড (Firebase ML to Cloud Storage migration guide ) দেখুন।

২. অবজেক্ট ডিটেক্টরটি কনফিগার করুন।

আপনার মডেল সোর্সগুলো কনফিগার করার পর, একটি CustomObjectDetectorOptions অবজেক্ট ব্যবহার করে আপনার ব্যবহারের ক্ষেত্র অনুযায়ী অবজেক্ট ডিটেক্টরটি কনফিগার করুন। আপনি নিম্নলিখিত সেটিংসগুলো পরিবর্তন করতে পারেন:

অবজেক্ট ডিটেক্টর সেটিংস
সনাক্তকরণ মোড	`STREAM_MODE` (ডিফল্ট) \| `SINGLE_IMAGE_MODE` `STREAM_MODE` (ডিফল্ট), অবজেক্ট ডিটেক্টর কম ল্যাটেন্সিতে চলে, কিন্তু ডিটেক্টরের প্রথম কয়েকটি চালনায় এটি অসম্পূর্ণ ফলাফল (যেমন অনির্দিষ্ট বাউন্ডিং বক্স বা ক্যাটাগরি লেবেল) দিতে পারে। এছাড়াও, `STREAM_MODE` ডিটেক্টর অবজেক্টগুলোকে ট্র্যাকিং আইডি প্রদান করে, যা ব্যবহার করে আপনি বিভিন্ন ফ্রেমে অবজেক্ট ট্র্যাক করতে পারেন। যখন আপনি অবজেক্ট ট্র্যাক করতে চান, অথবা যখন কম ল্যাটেন্সি গুরুত্বপূর্ণ, যেমন রিয়েল টাইমে ভিডিও স্ট্রিম প্রসেস করার সময়, তখন এই মোডটি ব্যবহার করুন। `SINGLE_IMAGE_MODE` এ, অবজেক্টের বাউন্ডিং বক্স নির্ধারিত হওয়ার পর অবজেক্ট ডিটেক্টর ফলাফল প্রদান করে। আপনি যদি ক্লাসিফিকেশনও চালু করেন, তবে বাউন্ডিং বক্স এবং ক্যাটাগরি লেবেল উভয়ই উপলব্ধ হওয়ার পর এটি ফলাফল প্রদান করে। ফলস্বরূপ, ডিটেকশন ল্যাটেন্সি সম্ভাব্যভাবে বেশি হতে পারে। এছাড়াও, `SINGLE_IMAGE_MODE` এ ট্র্যাকিং আইডি বরাদ্দ করা হয় না। এই মোডটি ব্যবহার করুন যদি ল্যাটেন্সি খুব গুরুত্বপূর্ণ না হয় এবং আপনি আংশিক ফলাফল নিয়ে কাজ করতে না চান।
একাধিক বস্তু সনাক্ত ও ট্র্যাক করুন	`false` (ডিফল্ট) \| `true` সর্বোচ্চ পাঁচটি বস্তু সনাক্ত ও ট্র্যাক করা হবে, নাকি শুধুমাত্র সবচেয়ে সুস্পষ্ট বস্তুটি (ডিফল্ট)।
বস্তু শ্রেণীবদ্ধ করুন	`false` (ডিফল্ট) \| `true` প্রদত্ত কাস্টম ক্লাসিফায়ার মডেল ব্যবহার করে শনাক্তকৃত বস্তুগুলোকে শ্রেণিবদ্ধ করা হবে কি না। আপনার কাস্টম ক্লাসিফিকেশন মডেল ব্যবহার করতে হলে, আপনাকে এটি ' `true` সেট করতে হবে।
শ্রেণিবিন্যাস আত্মবিশ্বাস থ্রেশহোল্ড	শনাক্তকৃত লেবেলগুলির সর্বনিম্ন কনফিডেন্স স্কোর। যদি এটি সেট করা না থাকে, তাহলে মডেলের মেটাডেটা দ্বারা নির্দিষ্ট করা যেকোনো ক্লাসিফায়ার থ্রেশহোল্ড ব্যবহার করা হবে। যদি মডেলে কোনো মেটাডেটা না থাকে অথবা মেটাডেটাতে কোনো ক্লাসিফায়ার থ্রেশহোল্ড নির্দিষ্ট করা না থাকে, তাহলে ০.০-এর একটি ডিফল্ট থ্রেশহোল্ড ব্যবহার করা হবে।
প্রতি বস্তুতে সর্বাধিক লেবেল	ডিটেক্টর প্রতিটি অবজেক্টের জন্য সর্বোচ্চ যতগুলো লেবেল ফেরত দেবে। যদি সেট করা না থাকে, তাহলে ডিফল্ট মান ১০ ব্যবহার করা হবে।

অবজেক্ট ডিটেকশন এবং ট্র্যাকিং এপিআইটি এই দুটি মূল ব্যবহারের ক্ষেত্রের জন্য অপ্টিমাইজ করা হয়েছে:

ক্যামেরার ভিউফাইন্ডারে থাকা সবচেয়ে সুস্পষ্ট বস্তুটির সরাসরি শনাক্তকরণ ও অনুসরণ।
একটি স্থির চিত্র থেকে একাধিক বস্তু শনাক্তকরণ।

এই ব্যবহারের ক্ষেত্রগুলির জন্য, একটি স্থানীয়ভাবে বান্ডেল করা মডেল সহ API কনফিগার করতে:

কোটলিন

// Live detection and tracking
val customObjectDetectorOptions =
        CustomObjectDetectorOptions.Builder(localModel)
        .setDetectorMode(CustomObjectDetectorOptions.STREAM_MODE)
        .enableClassification()
        .setClassificationConfidenceThreshold(0.5f)
        .setMaxPerObjectLabelCount(3)
        .build()

// Multiple object detection in static images
val customObjectDetectorOptions =
        CustomObjectDetectorOptions.Builder(localModel)
        .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE)
        .enableMultipleObjects()
        .enableClassification()
        .setClassificationConfidenceThreshold(0.5f)
        .setMaxPerObjectLabelCount(3)
        .build()

val objectDetector =
        ObjectDetection.getClient(customObjectDetectorOptions)

জাভা

// Live detection and tracking
CustomObjectDetectorOptions customObjectDetectorOptions =
        new CustomObjectDetectorOptions.Builder(localModel)
                .setDetectorMode(CustomObjectDetectorOptions.STREAM_MODE)
                .enableClassification()
                .setClassificationConfidenceThreshold(0.5f)
                .setMaxPerObjectLabelCount(3)
                .build();

// Multiple object detection in static images
CustomObjectDetectorOptions customObjectDetectorOptions =
        new CustomObjectDetectorOptions.Builder(localModel)
                .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE)
                .enableMultipleObjects()
                .enableClassification()
                .setClassificationConfidenceThreshold(0.5f)
                .setMaxPerObjectLabelCount(3)
                .build();

ObjectDetector objectDetector =
    ObjectDetection.getClient(customObjectDetectorOptions);

আপনার মডেলটি যদি দূরবর্তী স্থানে হোস্ট করা থাকে, তবে সেটি চালানোর আগে আপনাকে যাচাই করে নিতে হবে যে সেটি ডাউনলোড হয়েছে কি না।

যদিও ডিটেক্টরটি চালানোর আগে আপনাকে কেবল এটি নিশ্চিত করতে হবে, আপনার কাছে যদি একটি রিমোটলি-হোস্টেড মডেল এবং একটি লোকালি-বান্ডেলড মডেল উভয়ই থাকে, তবে ইমেজ ডিটেক্টরটি ইনস্ট্যানশিয়েট করার সময় এই চেকটি করে নেওয়া যুক্তিযুক্ত হতে পারে: যদি রিমোট মডেলটি ডাউনলোড করা হয়ে থাকে তবে সেটি থেকে ডিটেক্টরটি তৈরি করুন, এবং অন্যথায় লোকাল মডেলটি থেকে তৈরি করুন।

কোটলিন

val modelFile = File(context.cacheDir, "my_remote_model.tflite")

val model = if (modelFile.exists()) {
    // Use the downloaded model if available
    LocalModel.Builder().setAbsoluteFilePath(modelFile.absolutePath).build()
} else {
    // Fall back to the bundled model
    LocalModel.Builder().setAssetFilePath("model.tflite").build()
}

val customObjectDetectorOptions =
        CustomObjectDetectorOptions.Builder(model)
        .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE)
        .enableClassification()
        .setClassificationConfidenceThreshold(0.5f)
        .setMaxPerObjectLabelCount(3)
        .build()

val objectDetector =
        ObjectDetection.getClient(customObjectDetectorOptions)

জাভা

File modelFile = new File(context.getCacheDir(), "my_remote_model.tflite");

LocalModel model;
if (modelFile.exists()) {
    // Use the downloaded model if available
    model = new LocalModel.Builder().setAbsoluteFilePath(modelFile.getAbsolutePath()).build();
} else {
    // Fall back to the bundled model
    model = new LocalModel.Builder().setAssetFilePath("model.tflite").build();
}

CustomObjectDetectorOptions customObjectDetectorOptions =
        new CustomObjectDetectorOptions.Builder(model)
                .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE)
                .enableClassification()
                .setClassificationConfidenceThreshold(0.5f)
                .setMaxPerObjectLabelCount(3)
                .build();

ObjectDetector objectDetector =
        ObjectDetection.getClient(customObjectDetectorOptions);

আপনার কাছে যদি শুধুমাত্র দূরবর্তী স্থানে হোস্ট করা কোনো মডেল থাকে, তাহলে মডেলটি ডাউনলোড হয়েছে কিনা তা নিশ্চিত না হওয়া পর্যন্ত মডেল-সম্পর্কিত কার্যকারিতা নিষ্ক্রিয় করে রাখা উচিত—যেমন, আপনার UI-এর কোনো অংশ ধূসর করে দেওয়া বা লুকিয়ে রাখা।

কোটলিন

val localFile = File(context.cacheDir, "my_remote_model.tflite")
if (localFile.exists()) {
    // Model is already cached, initialize immediately
    initializeDetector(localFile)
} else {
    // Model is not yet available, show loading UI and start download
    showLoadingUI()
    val storage = Firebase.storage
    val modelRef = storage.getReferenceFromUrl("gs://YOUR_BUCKET/path/to/model.tflite")
    modelRef.getFile(localFile)
        .addOnSuccessListener {
            // Download complete, initialize the detector
            hideLoadingUI()
            initializeDetector(localFile)
        }
        .addOnFailureListener {
            // Handle download error
            showErrorUI()
        }
}

private fun initializeDetector(modelFile: File) {
    val localModel = LocalModel.Builder().setAbsoluteFilePath(modelFile.absolutePath).build()
    val customObjectDetectorOptions = CustomObjectDetectorOptions.Builder(localModel)
            .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE)
            .enableClassification()
            .build()
    val objectDetector = ObjectDetection.getClient(customObjectDetectorOptions)
    // Enable ML-related UI features here
    enableMLFeatures(objectDetector)
}

জাভা

File localFile = new File(context.getCacheDir(), "my_remote_model.tflite");
if (localFile.exists()) {
    // Model is already cached, initialize immediately
    initializeDetector(localFile);
} else {
    // Model is not yet available, show loading UI and start download
    showLoadingUI();
    FirebaseStorage storage = FirebaseStorage.getInstance();
    StorageReference modelRef = storage.getReferenceFromUrl("gs://YOUR_BUCKET/path/to/model.tflite");
    modelRef.getFile(localFile)
        .addOnSuccessListener(new OnSuccessListener<FileDownloadTask.TaskSnapshot>() {
            @Override
            public void onSuccess(FileDownloadTask.TaskSnapshot taskSnapshot) {
                // Download complete, initialize the detector
                hideLoadingUI();
                initializeDetector(localFile);
            }
        })
        .addOnFailureListener(new OnFailureListener() {
            @Override
            public void onFailure(@NonNull Exception exception) {
                // Handle download error
                showErrorUI();
            }
        });
}

private void initializeDetector(File modelFile) {
    LocalModel localModel = new LocalModel.Builder().setAbsoluteFilePath(modelFile.getAbsolutePath()).build();
    CustomObjectDetectorOptions customObjectDetectorOptions =
            new CustomObjectDetectorOptions.Builder(localModel)
                    .setDetectorMode(CustomObjectDetectorOptions.SINGLE_IMAGE_MODE)
                    .enableClassification()
                    .build();
    ObjectDetector objectDetector = ObjectDetection.getClient(customObjectDetectorOptions);
    // Enable ML-related UI features here
    enableMLFeatures(objectDetector);
}

৩. ইনপুট চিত্রটি প্রস্তুত করুন।

আপনার ইমেজ থেকে একটি InputImage অবজেক্ট তৈরি করুন। অবজেক্ট ডিটেক্টরটি সরাসরি একটি Bitmap , NV21 ByteBuffer বা একটি YUV_420_888 media.Image থেকে চলে। যদি আপনার এগুলোর কোনো একটিতে সরাসরি অ্যাক্সেস থাকে, তবে সেখান থেকে একটি InputImage তৈরি করার পরামর্শ দেওয়া হয়। আপনি যদি অন্য কোনো উৎস থেকে একটি InputImage তৈরি করেন, তবে আমরা আপনার জন্য অভ্যন্তরীণভাবে রূপান্তরের কাজটি করে দেব এবং এটি ততটা কার্যকর নাও হতে পারে।

আপনি বিভিন্ন উৎস থেকে একটি InputImage অবজেক্ট তৈরি করতে পারেন, যার প্রতিটি নিচে ব্যাখ্যা করা হলো।

একটি `media.Image` ব্যবহার করে।

একটি media.Image অবজেক্ট থেকে InputImage অবজেক্ট তৈরি করতে, যেমন যখন আপনি ডিভাইসের ক্যামেরা থেকে একটি ছবি তোলেন, তখন media.Image অবজেক্টটি এবং ছবিটির রোটেশন InputImage.fromMediaImage() ফাংশনে পাস করুন।

আপনি CameraX লাইব্রেরি ব্যবহার করলে, OnImageCapturedListener এবং ImageAnalysis.Analyzer ক্লাসগুলো আপনার জন্য ঘূর্ণন মান গণনা করে দেয়।

কোটলিন

private class YourImageAnalyzer : ImageAnalysis.Analyzer {

    override fun analyze(imageProxy: ImageProxy) {
        val mediaImage = imageProxy.image
        if (mediaImage != null) {
            val image = InputImage.fromMediaImage(mediaImage, imageProxy.imageInfo.rotationDegrees)
            // Pass image to an ML Kit Vision API
            // ...
        }
    }
}

জাভা

private class YourAnalyzer implements ImageAnalysis.Analyzer {

    @Override
    public void analyze(ImageProxy imageProxy) {
        Image mediaImage = imageProxy.getImage();
        if (mediaImage != null) {
          InputImage image =
                InputImage.fromMediaImage(mediaImage, imageProxy.getImageInfo().getRotationDegrees());
          // Pass image to an ML Kit Vision API
          // ...
        }
    }
}

যদি আপনি এমন কোনো ক্যামেরা লাইব্রেরি ব্যবহার না করেন যা আপনাকে ছবির ঘূর্ণন মাত্রা জানিয়ে দেয়, তাহলে আপনি ডিভাইসের ঘূর্ণন মাত্রা এবং ডিভাইসের ক্যামেরা সেন্সরের অভিমুখ থেকে এটি গণনা করতে পারেন:

কোটলিন

private val ORIENTATIONS = SparseIntArray()

init {
    ORIENTATIONS.append(Surface.ROTATION_0, 0)
    ORIENTATIONS.append(Surface.ROTATION_90, 90)
    ORIENTATIONS.append(Surface.ROTATION_180, 180)
    ORIENTATIONS.append(Surface.ROTATION_270, 270)
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
@Throws(CameraAccessException::class)
private fun getRotationCompensation(cameraId: String, activity: Activity, isFrontFacing: Boolean): Int {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    val deviceRotation = activity.windowManager.defaultDisplay.rotation
    var rotationCompensation = ORIENTATIONS.get(deviceRotation)

    // Get the device's sensor orientation.
    val cameraManager = activity.getSystemService(CAMERA_SERVICE) as CameraManager
    val sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION)!!

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360
    }
    return rotationCompensation
}MLKitVisionImage.kt

জাভা

private static final SparseIntArray ORIENTATIONS = new SparseIntArray();
static {
    ORIENTATIONS.append(Surface.ROTATION_0, 0);
    ORIENTATIONS.append(Surface.ROTATION_90, 90);
    ORIENTATIONS.append(Surface.ROTATION_180, 180);
    ORIENTATIONS.append(Surface.ROTATION_270, 270);
}

/**
 * Get the angle by which an image must be rotated given the device's current
 * orientation.
 */
@RequiresApi(api = Build.VERSION_CODES.LOLLIPOP)
private int getRotationCompensation(String cameraId, Activity activity, boolean isFrontFacing)
        throws CameraAccessException {
    // Get the device's current rotation relative to its "native" orientation.
    // Then, from the ORIENTATIONS table, look up the angle the image must be
    // rotated to compensate for the device's rotation.
    int deviceRotation = activity.getWindowManager().getDefaultDisplay().getRotation();
    int rotationCompensation = ORIENTATIONS.get(deviceRotation);

    // Get the device's sensor orientation.
    CameraManager cameraManager = (CameraManager) activity.getSystemService(CAMERA_SERVICE);
    int sensorOrientation = cameraManager
            .getCameraCharacteristics(cameraId)
            .get(CameraCharacteristics.SENSOR_ORIENTATION);

    if (isFrontFacing) {
        rotationCompensation = (sensorOrientation + rotationCompensation) % 360;
    } else { // back-facing
        rotationCompensation = (sensorOrientation - rotationCompensation + 360) % 360;
    }
    return rotationCompensation;
}

এরপর, media.Image অবজেক্ট এবং ঘূর্ণন ডিগ্রির মানটি InputImage.fromMediaImage() -এ পাস করুন:

কোটলিন

val image = InputImage.fromMediaImage(mediaImage, rotation)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromMediaImage(mediaImage, rotation);

একটি ফাইল URI ব্যবহার করে

একটি ফাইল URI থেকে InputImage অবজেক্ট তৈরি করতে, InputImage.fromFilePath() -এ অ্যাপ কনটেক্সট এবং ফাইল URI পাস করুন। এটি তখন কাজে আসে যখন আপনি ACTION_GET_CONTENT ইন্টেন্ট ব্যবহার করে ব্যবহারকারীকে তার গ্যালারি অ্যাপ থেকে একটি ছবি বেছে নিতে বলেন।

কোটলিন

val image: InputImage
try {
    image = InputImage.fromFilePath(context, uri)
} catch (e: IOException) {
    e.printStackTrace()
}MLKitVisionImage.kt

Java

InputImage image;
try {
    image = InputImage.fromFilePath(context, uri);
} catch (IOException e) {
    e.printStackTrace();
}

`ByteBuffer` বা `ByteArray` ব্যবহার করে

একটি ByteBuffer বা ByteArray থেকে InputImage অবজেক্ট তৈরি করতে, প্রথমে media.Image ইনপুটের জন্য পূর্বে বর্ণিত পদ্ধতি অনুযায়ী ছবির ঘূর্ণন মাত্রা গণনা করুন। তারপর, বাফার বা অ্যারেটি ব্যবহার করে ছবির উচ্চতা, প্রস্থ, কালার এনকোডিং ফরম্যাট এবং ঘূর্ণন মাত্রা সহ InputImage অবজেক্টটি তৈরি করুন।

কোটলিন

val image = InputImage.fromByteBuffer(
        byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)MLKitVisionImage.kt
// Or:
val image = InputImage.fromByteArray(
        byteArray,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
)
MLKitVisionImage.kt

জাভা

InputImage image = InputImage.fromByteBuffer(byteBuffer,
        /* image width */ 480,
        /* image height */ 360,
        rotationDegrees,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java
// Or:
InputImage image = InputImage.fromByteArray(
        byteArray,
        /* image width */480,
        /* image height */360,
        rotation,
        InputImage.IMAGE_FORMAT_NV21 // or IMAGE_FORMAT_YV12
);MLKitVisionImage.java

`Bitmap` ব্যবহার করে

একটি Bitmap অবজেক্ট থেকে InputImage অবজেক্ট তৈরি করতে, নিম্নলিখিত ডিক্লারেশনটি করুন:

কোটলিন

val image = InputImage.fromBitmap(bitmap, 0)MLKitVisionImage.kt

Java

InputImage image = InputImage.fromBitmap(bitmap, rotationDegree);MLKitVisionImage.java

ছবিটি ঘূর্ণন মাত্রা সহ একটি Bitmap অবজেক্ট দ্বারা উপস্থাপিত হয়।

৪. অবজেক্ট ডিটেক্টরটি চালান।

কোটলিন

objectDetector
    .process(image)
    .addOnFailureListener(e -> {...})
    .addOnSuccessListener(results -> {
        for (detectedObject in results) {
          // ...
        }
    });

জাভা

objectDetector
    .process(image)
    .addOnFailureListener(e -> {...})
    .addOnSuccessListener(results -> {
        for (DetectedObject detectedObject : results) {
          // ...
        }
    });

দ্রষ্টব্য: আপনি যদি CameraX API ব্যবহার করেন, তবে এর ব্যবহার শেষ হলে ImageProxy টি বন্ধ করে দিতে ভুলবেন না। উদাহরণস্বরূপ, process মেথড থেকে রিটার্ন করা Task এ একটি OnCompleteListener যোগ করে এটি করতে পারেন। একটি উদাহরণের জন্য কুইকস্টার্ট স্যাম্পল অ্যাপের VisionProcessorBase ক্লাসটি দেখুন।

৫. চিহ্নিত বস্তুগুলো সম্পর্কে তথ্য সংগ্রহ করুন।

যদি process() কলটি সফল হয়, তাহলে DetectedObject গুলোর একটি তালিকা success listener-এ পাঠানো হয়।

প্রতিটি DetectedObject নিম্নলিখিত প্রোপার্টিগুলো থাকে:

বাউন্ডিং বক্স একটি Rect যা ছবিতে বস্তুটির অবস্থান নির্দেশ করে।

ট্র্যাকিং আইডি একটি পূর্ণসংখ্যা যা একাধিক ছবির মধ্যে বস্তুটিকে শনাক্ত করে। SINGLE_IMAGE_MODE-এ এর মান নাল (Null)।

লেবেল

লেবেলের বিবরণ	লেবেলের পাঠ্য বিবরণ। এটি শুধুমাত্র তখনই ফেরত দেওয়া হয়, যখন LiteRT মডেলের মেটাডেটাতে লেবেলের বিবরণ থাকে।
লেবেল সূচক	ক্লাসিফায়ার দ্বারা সমর্থিত সমস্ত লেবেলের মধ্যে লেবেলটির সূচক।
লেবেল আত্মবিশ্বাস	বস্তু শ্রেণিবিন্যাসের আত্মবিশ্বাস মান।

কোটলিন

// The list of detected objects contains one item if multiple
// object detection wasn't enabled.
for (detectedObject in results) {
    val boundingBox = detectedObject.boundingBox
    val trackingId = detectedObject.trackingId
    for (label in detectedObject.labels) {
      val text = label.text
      val index = label.index
      val confidence = label.confidence
    }
}

জাভা

// The list of detected objects contains one item if multiple
// object detection wasn't enabled.
for (DetectedObject detectedObject : results) {
  Rect boundingBox = detectedObject.getBoundingBox();
  Integer trackingId = detectedObject.getTrackingId();
  for (Label label : detectedObject.getLabels()) {
    String text = label.getText();
    int index = label.getIndex();
    float confidence = label.getConfidence();
  }
}

একটি দুর্দান্ত ব্যবহারকারীর অভিজ্ঞতা নিশ্চিত করা

সর্বোত্তম ব্যবহারকারী অভিজ্ঞতার জন্য, আপনার অ্যাপে এই নির্দেশিকাগুলো অনুসরণ করুন:

সফল বস্তু শনাক্তকরণ বস্তুটির দৃশ্যমান জটিলতার উপর নির্ভর করে। শনাক্ত হওয়ার জন্য, অল্প সংখ্যক দৃশ্যমান বৈশিষ্ট্যযুক্ত বস্তুকে ছবির একটি বড় অংশ জুড়ে থাকতে হতে পারে। আপনি যে ধরনের বস্তু শনাক্ত করতে চান, সেগুলোর জন্য উপযুক্ত ইনপুট গ্রহণের বিষয়ে ব্যবহারকারীদের নির্দেশনা দেওয়া উচিত।
ক্লাসিফিকেশন ব্যবহার করার সময়, যদি আপনি এমন বস্তু শনাক্ত করতে চান যা সমর্থিত বিভাগগুলোর কোনোটিতেই স্পষ্টভাবে পড়ে না, তাহলে অজানা বস্তুগুলোর জন্য বিশেষ ব্যবস্থা গ্রহণ করুন।

এছাড়াও, এমএল কিট ম্যাটেরিয়াল ডিজাইন শোকেস অ্যাপ এবং মেশিন লার্নিং-চালিত ফিচারগুলোর জন্য ম্যাটেরিয়াল ডিজাইন প্যাটার্নস কালেকশনটি দেখে নিন।

কর্মক্ষমতা উন্নত করা

আপনি যদি কোনো রিয়েল-টাইম অ্যাপ্লিকেশনে অবজেক্ট ডিটেকশন ব্যবহার করতে চান, তাহলে সর্বোত্তম ফ্রেমরেট পেতে এই নির্দেশিকাগুলো অনুসরণ করুন:

রিয়েল-টাইম অ্যাপ্লিকেশনে স্ট্রিমিং মোড ব্যবহার করার সময় মাল্টিপল অবজেক্ট ডিটেকশন ব্যবহার করবেন না, কারণ বেশিরভাগ ডিভাইস পর্যাপ্ত ফ্রেমরেট তৈরি করতে সক্ষম হবে না।
আপনি যদি Camera বা camera2 API ব্যবহার করেন, তাহলে ডিটেক্টরে কল করার গতি সীমিত করুন। ডিটেক্টর চলার সময় যদি একটি নতুন ভিডিও ফ্রেম উপলব্ধ হয়, তাহলে ফ্রেমটি বাদ দিন। একটি উদাহরণের জন্য কুইকস্টার্ট স্যাম্পল অ্যাপে VisionProcessorBase ক্লাসটি দেখুন।
আপনি যদি CameraX API ব্যবহার করেন, তাহলে নিশ্চিত করুন যে ব্যাকপ্রেশার স্ট্র্যাটেজি তার ডিফল্ট মান ImageAnalysis.STRATEGY_KEEP_ONLY_LATEST এ সেট করা আছে। এটি নিশ্চিত করে যে একবারে বিশ্লেষণের জন্য কেবল একটি ছবিই পাঠানো হবে। অ্যানালাইজার ব্যস্ত থাকা অবস্থায় যদি আরও ছবি তৈরি হয়, তবে সেগুলি স্বয়ংক্রিয়ভাবে বাদ হয়ে যাবে এবং পাঠানোর জন্য সারিতে যুক্ত হবে না। ImageProxy.close() কল করে বিশ্লেষণাধীন ছবিটি বন্ধ করা হলে, পরবর্তী সর্বশেষ ছবিটি পাঠানো হবে।
যদি আপনি ইনপুট ইমেজের উপর গ্রাফিক্স ওভারলে করার জন্য ডিটেক্টরের আউটপুট ব্যবহার করেন, তাহলে প্রথমে এমএল কিট (ML Kit) থেকে ফলাফলটি নিন, তারপর ইমেজটি রেন্ডার করুন এবং একটি একক ধাপে ওভারলে করুন। এর ফলে প্রতিটি ইনপুট ফ্রেমের জন্য ডিসপ্লে সারফেসে কেবল একবারই রেন্ডার হয়। একটি উদাহরণের জন্য কুইকস্টার্ট স্যাম্পল অ্যাপে CameraSourcePreview এবং GraphicOverlay ক্লাসগুলো দেখুন।
আপনি যদি Camera2 API ব্যবহার করেন, তাহলে ImageFormat.YUV_420_888 ফরম্যাটে ছবি তুলুন। আর যদি পুরোনো Camera API ব্যবহার করেন, তাহলে ImageFormat.NV21 ফরম্যাটে ছবি তুলুন।

চেষ্টা করে দেখুন

শুরু করার আগে

১. মডেলটি লোড করুন

একটি স্থানীয় মডেল উৎস কনফিগার করুন

কোটলিন

জাভা

দূরবর্তীভাবে হোস্ট করা মডেল উৎস কনফিগার করুন

২. অবজেক্ট ডিটেক্টরটি কনফিগার করুন।

কোটলিন

জাভা

কোটলিন

জাভা

কোটলিন

জাভা

৩. ইনপুট চিত্রটি প্রস্তুত করুন।

একটি media.Image ব্যবহার করে।

কোটলিন

জাভা

কোটলিন

জাভা

কোটলিন

Java

একটি ফাইল URI ব্যবহার করে

কোটলিন

Java

ByteBuffer বা ByteArray ব্যবহার করে

কোটলিন

জাভা

Bitmap ব্যবহার করে

কোটলিন

Java

৪. অবজেক্ট ডিটেক্টরটি চালান।

কোটলিন

জাভা

৫. চিহ্নিত বস্তুগুলো সম্পর্কে তথ্য সংগ্রহ করুন।

কোটলিন

জাভা

একটি দুর্দান্ত ব্যবহারকারীর অভিজ্ঞতা নিশ্চিত করা

কর্মক্ষমতা উন্নত করা

একটি `media.Image` ব্যবহার করে।

`ByteBuffer` বা `ByteArray` ব্যবহার করে

`Bitmap` ব্যবহার করে