
এমএল কিট-এর ইমেজ লেবেলিং এপিআই ব্যবহার করে আপনি একটি ছবির মধ্যে থাকা বিভিন্ন ক্যাটাগরির সত্তা শনাক্ত ও সে সম্পর্কে তথ্য বের করতে পারেন। এর ডিফল্ট ইমেজ লেবেলিং মডেলটি সাধারণ বস্তু, স্থান, কার্যকলাপ, প্রাণী প্রজাতি, পণ্য এবং আরও অনেক কিছু শনাক্ত করতে পারে।
আপনি একটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে ডিটেকশনকে উপযোগী করে তোলার জন্য একটি কাস্টম ইমেজ ক্লাসিফিকেশন মডেলও ব্যবহার করতে পারেন। আরও তথ্যের জন্য ‘Using a custom LiteRT model’ দেখুন।
মূল সক্ষমতা
- একটি শক্তিশালী সাধারণ-উদ্দেশ্যমূলক বেস ক্লাসিফায়ার যা ৪০০টিরও বেশি ক্যাটাগরি শনাক্ত করে, যেগুলো ছবিতে সবচেয়ে বেশি পাওয়া যায় এমন বস্তুগুলোকে বর্ণনা করে।
- কাস্টম মডেলের সাহায্যে আপনার ব্যবহারের ক্ষেত্র অনুযায়ী সাজিয়ে নিন। TensorFlow Hub থেকে অন্যান্য প্রি-ট্রেইনড মডেল অথবা TensorFlow, AutoML বা LiteRT দিয়ে প্রশিক্ষিত আপনার নিজস্ব কাস্টম মডেল ব্যবহার করুন।
- ব্যবহার করা সহজ উচ্চ-স্তরের এপিআই। নিম্ন-স্তরের মডেল ইনপুট/আউটপুট, ছবির প্রি- এবং পোস্ট-প্রসেসিং, বা একটি প্রসেসিং পাইপলাইন তৈরি করার প্রয়োজন নেই। এমএল কিট LiteRT মডেল থেকে লেবেলগুলো বের করে এবং সেগুলোকে একটি টেক্সট বিবরণ হিসেবে প্রদান করে।
উল্লেখ্য যে, এই এপিআইটি এমন ইমেজ ক্লাসিফিকেশন মডেলের জন্য তৈরি করা হয়েছে যা সম্পূর্ণ ছবিটি বর্ণনা করে। কোনো ছবিতে থাকা এক বা একাধিক বস্তু, যেমন জুতো বা আসবাবপত্র, শ্রেণীবদ্ধ করার জন্য অবজেক্ট ডিটেকশন অ্যান্ড ট্র্যাকিং এপিআই আরও উপযুক্ত হতে পারে।
সমর্থিত চিত্র শ্রেণিবিন্যাস মডেল
ইমেজ লেবেলিং এপিআইগুলো বিভিন্ন ইমেজ ক্লাসিফিকেশন মডেল সমর্থন করে:
| সমর্থিত চিত্র শ্রেণিবিন্যাস মডেল | |
|---|---|
| বেস মডেল | ডিফল্টরূপে এপিআইটি একটি শক্তিশালী সাধারণ-উদ্দেশ্যমূলক ইমেজ লেবেলিং মডেল ব্যবহার করে, যা ছবিতে সবচেয়ে সাধারণভাবে পাওয়া ধারণাগুলোকে অন্তর্ভুক্ত করে এমন ৪০০টিরও বেশি সত্তা শনাক্ত করতে পারে। |
| কাস্টম LiteRT মডেল | অ্যাপ্লিকেশন-নির্দিষ্ট ধারণাগুলোকে লক্ষ্য করার জন্য, এপিআইটি বিভিন্ন উৎস থেকে কাস্টম ইমেজ ক্লাসিফিকেশন মডেল গ্রহণ করে। এগুলো হতে পারে টেনসরফ্লো হাব (TensorFlow Hub) থেকে ডাউনলোড করা প্রি-ট্রেইনড মডেল অথবা অটোএমএল (AutoML), লাইটআরটি (LiteRT), বা সরাসরি টেনসরফ্লো (TensorFlow) দিয়ে প্রশিক্ষিত আপনার নিজস্ব মডেল। মডেলগুলো আপনার অ্যাপের সাথে বান্ডল করা যেতে পারে অথবা ক্লাউড স্টোরেজে হোস্ট করে রান-টাইমে ডাউনলোড করা যেতে পারে। |
বেস মডেল ব্যবহার করে
এমএল কিট-এর বেস মডেলটি এমন কিছু এনটিটির একটি তালিকা প্রদান করে, যা মানুষ, বস্তু, স্থান, কার্যকলাপ ইত্যাদিকে শনাক্ত করে। প্রতিটি এনটিটির সাথে একটি স্কোর থাকে, যা এর প্রাসঙ্গিকতার বিষয়ে এমএল মডেলের আস্থার মাত্রা নির্দেশ করে। এই তথ্য ব্যবহার করে আপনি স্বয়ংক্রিয় মেটাডেটা তৈরি এবং কন্টেন্ট মডারেশনের মতো কাজগুলো সম্পাদন করতে পারেন। এমএল কিট-এর সাথে প্রদত্ত ডিফল্ট মডেলটি ৪০০-এরও বেশি বিভিন্ন ধরনের এনটিটি শনাক্ত করতে পারে।
উদাহরণ লেবেল
ইমেজ লেবেলিং এপিআই-এর বেস মডেলটি ৪০০টিরও বেশি লেবেল সমর্থন করে, যেমন নিম্নলিখিত উদাহরণগুলো:
| বিভাগ | উদাহরণ লেবেল |
|---|---|
| মানুষ | CrowdSelfieSmile |
| কার্যকলাপ | DancingEatingSurfing |
| জিনিসগুলি | CarPianoReceipt |
| পশু | BirdCatDog |
| গাছপালা | FlowerFruitVegetable |
| স্থান | BeachLakeMountain |
উদাহরণ ফলাফল
সংযুক্ত ছবিতে শনাক্ত করা সত্তাগুলোর একটি উদাহরণ এখানে দেওয়া হলো।

| লেবেল 0 | |
|---|---|
| পাঠ্য | স্টেডিয়াম |
| আত্মবিশ্বাস | ০.৯২০৫৩৫৪ |
| লেবেল ১ | |
| পাঠ্য | খেলাধুলা |
| আত্মবিশ্বাস | ০.৭৫৩১১০০৯ |
| লেবেল ২ | |
| পাঠ্য | অনুষ্ঠান |
| আত্মবিশ্বাস | ০.৬৬৯০৫২৯৬ |
| লেবেল ৩ | |
| পাঠ্য | অবসর |
| আত্মবিশ্বাস | ০.৫৯৯০৪১৪৬ |
| লেবেল ৪ | |
| পাঠ্য | ফুটবল |
| আত্মবিশ্বাস | ০.৫৬৩৮৪৫৩৪ |
| লেবেল ৫ | |
| পাঠ্য | নেট |
| আত্মবিশ্বাস | ০.৫৪৬৭৯১৮৫ |
| লেবেল ৬ | |
| পাঠ্য | উদ্ভিদ |
| আত্মবিশ্বাস | ০.৫২৪৩৬৪ |
একটি কাস্টম LiteRT মডেল ব্যবহার করে
এমএল কিট-এর বেস ইমেজ লেবেলিং মডেলটি সাধারণ ব্যবহারের জন্য তৈরি করা হয়েছে। এটিকে ৪০০টি ক্যাটাগরি শনাক্ত করার জন্য প্রশিক্ষণ দেওয়া হয়েছে, যা ছবিতে সবচেয়ে বেশি পাওয়া যায় এমন বস্তুগুলোকে বর্ণনা করে। আপনার অ্যাপের জন্য একটি বিশেষায়িত ইমেজ ক্লাসিফিকেশন মডেলের প্রয়োজন হতে পারে, যা আরও কম সংখ্যক ক্যাটাগরিকে আরও বিস্তারিতভাবে শনাক্ত করতে পারে; যেমন এমন একটি মডেল যা ফুলের প্রজাতি বা খাবারের প্রকারভেদের মধ্যে পার্থক্য করতে পারে।
এই API আপনাকে বিভিন্ন উৎস থেকে কাস্টম ইমেজ ক্লাসিফিকেশন মডেল সমর্থন করার মাধ্যমে একটি নির্দিষ্ট ব্যবহারের জন্য এটিকে উপযোগী করে তোলার সুযোগ দেয়। আরও জানতে ML Kit-এর কাস্টম মডেলসমূহ দেখুন। কাস্টম মডেলগুলো আপনার অ্যাপের সাথে বান্ডল করা যেতে পারে অথবা ক্লাউড স্টোরেজ থেকে ডায়নামিকভাবে ডাউনলোড করা যেতে পারে।
ইনপুট ছবির প্রাক-প্রক্রিয়াকরণ
প্রয়োজন হলে, ইমেজ লেবেলিং বাইলিনিয়ার ইমেজ স্কেলিং এবং স্ট্রেচিং ব্যবহার করে ইনপুট ইমেজের আকার ও অ্যাসপেক্ট রেশিও এমনভাবে সমন্বয় করে, যাতে তা অন্তর্নিহিত মডেলের প্রয়োজনীয়তার সাথে সামঞ্জস্যপূর্ণ হয়।