বস্তু সনাক্তকরণ এবং ট্র্যাকিং

এমএল কিট-এর অন-ডিভাইস অবজেক্ট ডিটেকশন ও ট্র্যাকিং এপিআই-এর সাহায্যে, আপনি কোনো ছবি বা লাইভ ক্যামেরা ফিডে থাকা বস্তু শনাক্ত ও ট্র্যাক করতে পারেন।

ঐচ্ছিকভাবে, আপনি এপিআই-তে অন্তর্নির্মিত কোর্স ক্লাসিফায়ার ব্যবহার করে অথবা আপনার নিজস্ব কাস্টম ইমেজ ক্লাসিফিকেশন মডেল ব্যবহার করে শনাক্ত করা বস্তুগুলোকে শ্রেণিবদ্ধ করতে পারেন। আরও তথ্যের জন্য ‘Using a custom LiteRT model’ দেখুন।

যেহেতু অবজেক্ট ডিটেকশন এবং ট্র্যাকিং ডিভাইসেই সম্পন্ন হয়, তাই এটি ভিজ্যুয়াল সার্চ পাইপলাইনের ফ্রন্টএন্ড হিসেবে ভালোভাবে কাজ করে। অবজেক্ট ডিটেক্ট এবং ফিল্টার করার পর, আপনি সেগুলোকে ক্লাউড ভিশন প্রোডাক্ট সার্চ-এর মতো কোনো ক্লাউড ব্যাকএন্ডে পাঠাতে পারেন।

আইওএস অ্যান্ড্রয়েড

মূল সক্ষমতা

  • দ্রুত বস্তু শনাক্তকরণ ও অনুসরণ। ছবিতে বস্তু শনাক্ত করুন এবং তাদের অবস্থান জানুন। পরপর ইমেজ ফ্রেম জুড়ে বস্তুকে অনুসরণ করুন।
  • অপ্টিমাইজড অন-ডিভাইস মডেলটি মোবাইল ডিভাইসের জন্য অপ্টিমাইজ করা হয়েছে এবং এটি রিয়েল-টাইম অ্যাপ্লিকেশনে ব্যবহারের জন্য তৈরি, এমনকি নিম্নমানের ডিভাইসেও।
  • বিশিষ্ট বস্তু সনাক্তকরণ: একটি ছবির সবচেয়ে বিশিষ্ট বস্তুটি স্বয়ংক্রিয়ভাবে নির্ধারণ করুন।
  • স্থূল শ্রেণিবিন্যাস বস্তুগুলোকে বিস্তৃত শ্রেণীতে ভাগ করে, যা ব্যবহার করে আপনি আপনার অনাকাঙ্ক্ষিত বস্তুগুলো বাদ দিতে পারেন। নিম্নলিখিত শ্রেণীগুলো সমর্থিত: গৃহস্থালি সামগ্রী, ফ্যাশন সামগ্রী, খাদ্য, উদ্ভিদ এবং স্থান।
  • কাস্টম মডেলের সাহায্যে শ্রেণীকরণ। নির্দিষ্ট বস্তুর শ্রেণী শনাক্ত বা ফিল্টার করতে আপনার নিজস্ব কাস্টম ইমেজ ক্লাসিফিকেশন মডেল ব্যবহার করুন। ছবির ব্যাকগ্রাউন্ড বাদ দিয়ে আপনার কাস্টম মডেলের কার্যকারিতা আরও উন্নত করুন।

উদাহরণ ফলাফল

ছবি জুড়ে সবচেয়ে বিশিষ্ট বস্তুটি ট্র্যাক করা

নিম্নলিখিত উদাহরণটি এমএল কিট (ML Kit) দ্বারা প্রদত্ত ডিফল্ট কোর্স ক্লাসিফায়ার ব্যবহার করে পরপর তিনটি ফ্রেমের ট্র্যাকিং ডেটা দেখাচ্ছে।

ট্র্যাকিং আইডি
সীমানা (৯৫, ৪৫), (৪৯৬, ৪৫), (৪৯৬, ২৪০), (৯৫, ২৪০)
বিভাগ স্থান
শ্রেণিবিন্যাস আত্মবিশ্বাস ০.৯২৯৬৮৭৫
ট্র্যাকিং আইডি
সীমানা (৮৪, ৪৬), (৪৭৮, ৪৬), (৪৭৮, ২৪৭), (৮৪, ২৪৭)
বিভাগ স্থান
শ্রেণিবিন্যাস আত্মবিশ্বাস ০.৮৭১০৯৩৮
ট্র্যাকিং আইডি
সীমানা (৫৩, ৪৫), (৫১৯, ৪৫), (৫১৯, ২৪০), (৫৩, ২৪০)
বিভাগ স্থান
শ্রেণিবিন্যাস আত্মবিশ্বাস ০.৮৮২৮১২৫

ছবি: ক্রিশ্চিয়ান ফেরার [CC BY-SA 4.0]

একটি স্থির ছবিতে একাধিক বস্তু

নিম্নলিখিত উদাহরণটিতে এমএল কিট (ML Kit) দ্বারা প্রদত্ত ডিফল্ট কোর্স ক্লাসিফায়ার ব্যবহার করে ছবিতে শনাক্ত করা চারটি বস্তুর ডেটা দেখানো হয়েছে।

জুতা

বস্তু 0
সীমানা (1, 97), (332, 97), (332, 332), (1, 332)
বিভাগ ফ্যাশন_গুড
শ্রেণিবিন্যাস আত্মবিশ্বাস ০.৯৫৭০৩১২৫
বস্তু ১
সীমানা (১৮৬, ৮০), (৩৩৭, ৮০), (৩৩৭, ২২৬), (১৮৬, ২২৬)
বিভাগ ফ্যাশন_গুড
শ্রেণিবিন্যাস আত্মবিশ্বাস ০.৮৪৩৭৫
বস্তু ২
সীমানা (২৯৬, ৮০), (৪৭২, ৮০), (৪৭২, ৩৮৮), (২৯৬, ৩৮৮)
বিভাগ ফ্যাশন_গুড
শ্রেণিবিন্যাস আত্মবিশ্বাস ০.৯৪৯২১৮৭৫
বস্তু ৩
সীমানা (৪৩৯, ৮৩), (৬১৫, ৮৩), (৬১৫, ৩০৬), (৪৩৯, ৩০৬)
বিভাগ ফ্যাশন_গুড
শ্রেণিবিন্যাস আত্মবিশ্বাস ০.৯৩৭৫

একটি কাস্টম LiteRT মডেল ব্যবহার করে

ডিফল্ট স্থূল ক্লাসিফায়ারটি পাঁচটি বিভাগের জন্য তৈরি করা হয়েছে, যা শনাক্তকৃত বস্তুগুলো সম্পর্কে সীমিত তথ্য প্রদান করে। আপনার হয়তো আরও বিশেষায়িত একটি ক্লাসিফায়ার মডেলের প্রয়োজন হতে পারে, যা ধারণার একটি সংকীর্ণ ক্ষেত্রকে আরও বিস্তারিতভাবে অন্তর্ভুক্ত করে; উদাহরণস্বরূপ, ফুলের প্রজাতি বা খাদ্যের প্রকারভেদের মধ্যে পার্থক্য করার জন্য একটি মডেল।

এই API আপনাকে বিভিন্ন উৎস থেকে কাস্টম ইমেজ ক্লাসিফিকেশন মডেল সমর্থন করার মাধ্যমে একটি নির্দিষ্ট ব্যবহারের জন্য এটিকে উপযোগী করে তোলার সুযোগ দেয়। আরও জানতে ML Kit-এর কাস্টম মডেলসমূহ দেখুন। কাস্টম মডেলগুলো আপনার অ্যাপের সাথে বান্ডল করা যেতে পারে অথবা ক্লাউড স্টোরেজ থেকে ডায়নামিকভাবে ডাউনলোড করা যেতে পারে।

আইওএস অ্যান্ড্রয়েড

ইনপুট ছবির প্রাক-প্রক্রিয়াকরণ

প্রয়োজন হলে, অবজেক্ট ডিটেকশন এবং ট্র্যাকিং বাইলিনিয়ার ইমেজ স্কেলিং ও স্ট্রেচিং ব্যবহার করে ইনপুট ইমেজের আকার এবং অ্যাস্পেক্ট রেশিও সমন্বয় করে, যাতে সেগুলো অন্তর্নিহিত মডেলের প্রয়োজনীয়তার সাথে সামঞ্জস্যপূর্ণ হয়।