ইমেজ লেবেলিং

এমএল কিট-এর ইমেজ লেবেলিং এপিআই ব্যবহার করে আপনি একটি ছবির মধ্যে থাকা বিভিন্ন ক্যাটাগরির সত্তা শনাক্ত ও সে সম্পর্কে তথ্য বের করতে পারেন। এর ডিফল্ট ইমেজ লেবেলিং মডেলটি সাধারণ বস্তু, স্থান, কার্যকলাপ, প্রাণী প্রজাতি, পণ্য এবং আরও অনেক কিছু শনাক্ত করতে পারে।

আপনি একটি নির্দিষ্ট ব্যবহারের ক্ষেত্রে ডিটেকশনকে উপযোগী করে তোলার জন্য একটি কাস্টম ইমেজ ক্লাসিফিকেশন মডেলও ব্যবহার করতে পারেন। আরও তথ্যের জন্য ‘Using a custom LiteRT model’ দেখুন।

মূল সক্ষমতা

  • একটি শক্তিশালী সাধারণ-উদ্দেশ্যমূলক বেস ক্লাসিফায়ার যা ৪০০টিরও বেশি ক্যাটাগরি শনাক্ত করে, যেগুলো ছবিতে সবচেয়ে বেশি পাওয়া যায় এমন বস্তুগুলোকে বর্ণনা করে।
  • কাস্টম মডেলের সাহায্যে আপনার ব্যবহারের ক্ষেত্র অনুযায়ী সাজিয়ে নিন। TensorFlow Hub থেকে অন্যান্য প্রি-ট্রেইনড মডেল অথবা TensorFlow, AutoML বা LiteRT দিয়ে প্রশিক্ষিত আপনার নিজস্ব কাস্টম মডেল ব্যবহার করুন।
  • ব্যবহার করা সহজ উচ্চ-স্তরের এপিআই। নিম্ন-স্তরের মডেল ইনপুট/আউটপুট, ছবির প্রি- এবং পোস্ট-প্রসেসিং, বা একটি প্রসেসিং পাইপলাইন তৈরি করার প্রয়োজন নেই। এমএল কিট LiteRT মডেল থেকে লেবেলগুলো বের করে এবং সেগুলোকে একটি টেক্সট বিবরণ হিসেবে প্রদান করে।

উল্লেখ্য যে, এই এপিআইটি এমন ইমেজ ক্লাসিফিকেশন মডেলের জন্য তৈরি করা হয়েছে যা সম্পূর্ণ ছবিটি বর্ণনা করে। কোনো ছবিতে থাকা এক বা একাধিক বস্তু, যেমন জুতো বা আসবাবপত্র, শ্রেণীবদ্ধ করার জন্য অবজেক্ট ডিটেকশন অ্যান্ড ট্র্যাকিং এপিআই আরও উপযুক্ত হতে পারে।

সমর্থিত চিত্র শ্রেণিবিন্যাস মডেল

ইমেজ লেবেলিং এপিআইগুলো বিভিন্ন ইমেজ ক্লাসিফিকেশন মডেল সমর্থন করে:

সমর্থিত চিত্র শ্রেণিবিন্যাস মডেল
বেস মডেল ডিফল্টরূপে এপিআইটি একটি শক্তিশালী সাধারণ-উদ্দেশ্যমূলক ইমেজ লেবেলিং মডেল ব্যবহার করে, যা ছবিতে সবচেয়ে সাধারণভাবে পাওয়া ধারণাগুলোকে অন্তর্ভুক্ত করে এমন ৪০০টিরও বেশি সত্তা শনাক্ত করতে পারে।
কাস্টম LiteRT মডেল অ্যাপ্লিকেশন-নির্দিষ্ট ধারণাগুলোকে লক্ষ্য করার জন্য, এপিআইটি বিভিন্ন উৎস থেকে কাস্টম ইমেজ ক্লাসিফিকেশন মডেল গ্রহণ করে। এগুলো হতে পারে টেনসরফ্লো হাব (TensorFlow Hub) থেকে ডাউনলোড করা প্রি-ট্রেইনড মডেল অথবা অটোএমএল (AutoML), লাইটআরটি (LiteRT), বা সরাসরি টেনসরফ্লো (TensorFlow) দিয়ে প্রশিক্ষিত আপনার নিজস্ব মডেল। মডেলগুলো আপনার অ্যাপের সাথে বান্ডল করা যেতে পারে অথবা ক্লাউড স্টোরেজে হোস্ট করে রান-টাইমে ডাউনলোড করা যেতে পারে।

বেস মডেল ব্যবহার করে

এমএল কিট-এর বেস মডেলটি এমন কিছু এনটিটির একটি তালিকা প্রদান করে, যা মানুষ, বস্তু, স্থান, কার্যকলাপ ইত্যাদিকে শনাক্ত করে। প্রতিটি এনটিটির সাথে একটি স্কোর থাকে, যা এর প্রাসঙ্গিকতার বিষয়ে এমএল মডেলের আস্থার মাত্রা নির্দেশ করে। এই তথ্য ব্যবহার করে আপনি স্বয়ংক্রিয় মেটাডেটা তৈরি এবং কন্টেন্ট মডারেশনের মতো কাজগুলো সম্পাদন করতে পারেন। এমএল কিট-এর সাথে প্রদত্ত ডিফল্ট মডেলটি ৪০০-এরও বেশি বিভিন্ন ধরনের এনটিটি শনাক্ত করতে পারে।

আইওএস অ্যান্ড্রয়েড

উদাহরণ লেবেল

ইমেজ লেবেলিং এপিআই-এর বেস মডেলটি ৪০০টিরও বেশি লেবেল সমর্থন করে, যেমন নিম্নলিখিত উদাহরণগুলো:

বিভাগ উদাহরণ লেবেল
মানুষ Crowd
Selfie
Smile
কার্যকলাপ Dancing
Eating
Surfing
জিনিসগুলি Car
Piano
Receipt
পশু Bird
Cat
Dog
গাছপালা Flower
Fruit
Vegetable
স্থান Beach
Lake
Mountain

উদাহরণ ফলাফল

সংযুক্ত ছবিতে শনাক্ত করা সত্তাগুলোর একটি উদাহরণ এখানে দেওয়া হলো।

ছবি: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
লেবেল 0
পাঠ্য স্টেডিয়াম
আত্মবিশ্বাস ০.৯২০৫৩৫৪
লেবেল ১
পাঠ্য খেলাধুলা
আত্মবিশ্বাস ০.৭৫৩১১০০৯
লেবেল ২
পাঠ্য অনুষ্ঠান
আত্মবিশ্বাস ০.৬৬৯০৫২৯৬
লেবেল ৩
পাঠ্য অবসর
আত্মবিশ্বাস ০.৫৯৯০৪১৪৬
লেবেল ৪
পাঠ্য ফুটবল
আত্মবিশ্বাস ০.৫৬৩৮৪৫৩৪
লেবেল ৫
পাঠ্য নেট
আত্মবিশ্বাস ০.৫৪৬৭৯১৮৫
লেবেল ৬
পাঠ্য উদ্ভিদ
আত্মবিশ্বাস ০.৫২৪৩৬৪

একটি কাস্টম LiteRT মডেল ব্যবহার করে

এমএল কিট-এর বেস ইমেজ লেবেলিং মডেলটি সাধারণ ব্যবহারের জন্য তৈরি করা হয়েছে। এটিকে ৪০০টি ক্যাটাগরি শনাক্ত করার জন্য প্রশিক্ষণ দেওয়া হয়েছে, যা ছবিতে সবচেয়ে বেশি পাওয়া যায় এমন বস্তুগুলোকে বর্ণনা করে। আপনার অ্যাপের জন্য একটি বিশেষায়িত ইমেজ ক্লাসিফিকেশন মডেলের প্রয়োজন হতে পারে, যা আরও কম সংখ্যক ক্যাটাগরিকে আরও বিস্তারিতভাবে শনাক্ত করতে পারে; যেমন এমন একটি মডেল যা ফুলের প্রজাতি বা খাবারের প্রকারভেদের মধ্যে পার্থক্য করতে পারে।

এই API আপনাকে বিভিন্ন উৎস থেকে কাস্টম ইমেজ ক্লাসিফিকেশন মডেল সমর্থন করার মাধ্যমে একটি নির্দিষ্ট ব্যবহারের জন্য এটিকে উপযোগী করে তোলার সুযোগ দেয়। আরও জানতে ML Kit-এর কাস্টম মডেলসমূহ দেখুন। কাস্টম মডেলগুলো আপনার অ্যাপের সাথে বান্ডল করা যেতে পারে অথবা ক্লাউড স্টোরেজ থেকে ডায়নামিকভাবে ডাউনলোড করা যেতে পারে।

আইওএস অ্যান্ড্রয়েড

ইনপুট ছবির প্রাক-প্রক্রিয়াকরণ

প্রয়োজন হলে, ইমেজ লেবেলিং বাইলিনিয়ার ইমেজ স্কেলিং এবং স্ট্রেচিং ব্যবহার করে ইনপুট ইমেজের আকার ও অ্যাসপেক্ট রেশিও এমনভাবে সমন্বয় করে, যাতে তা অন্তর্নিহিত মডেলের প্রয়োজনীয়তার সাথে সামঞ্জস্যপূর্ণ হয়।