পাঠ্য নিষ্কাশনের জন্য সমর্থিত ফাইল প্রকার

ক্লাউড সার্চ ফাইলের ধরন (MIME বা বিষয়বস্তুর প্রকার) নির্বিশেষে পাঠানো সমস্ত আইটেমকে সূচী করে। সূচীকরণ একটি ফাইলের মেটাডেটা ডেটা এবং সমর্থিত হলে, এর বিষয়বস্তুর উপর সঞ্চালিত হয়। নিম্নলিখিত ফাইল প্রকারের একটি তালিকা রয়েছে যার জন্য সামগ্রী সূচীকরণ সমর্থিত

  • মাইক্রোসফট ওয়ার্ড (DOC)
  • মাইক্রোসফট ওয়ার্ড (DOCX)
  • মাইক্রোসফট এক্সেল (এক্সএলএস)
  • মাইক্রোসফট এক্সেল (XLSX)
  • মাইক্রোসফট পাওয়ারপয়েন্ট (PPT)
  • মাইক্রোসফট পাওয়ারপয়েন্ট (PPTX)
  • Adobe এর পোর্টেবল ডকুমেন্ট ফরম্যাট (PDF)
  • রিচ টেক্সট ফরম্যাট (RTF)
  • পাঠ্য বিন্যাস (TXT)
  • হাইপারটেক্সট মার্কআপ ল্যাঙ্গুয়েজ (HTML)
  • এক্সটেনসিবল মার্কআপ ল্যাঙ্গুয়েজ (XML)

এই ধরনের ফাইলগুলি ছাড়াও, ক্লাউড অনুসন্ধান যেকোনো প্লেইন টেক্সট ফাইলের মধ্যে সামগ্রীর সূচীকরণ সমর্থন করে।

অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) ফাইলের ধরন এবং বৈশিষ্ট্য

Google ক্লাউড সার্চও নিম্নলিখিত ফাইল প্রকারগুলি থেকে পাঠ্য বের করতে OCR ব্যবহার করে:

ফাইলের ধরন সর্বাধিক আকার
জয়েন্ট ফটোগ্রাফিক এক্সপার্ট গ্রুপ (JPG) 10 MB
গ্রাফিক ইন্টারচেঞ্জ ফরম্যাট (GIF) 10 MB
ট্যাগ করা ছবি ফাইল ফরম্যাট (TIFF) 10 MB
স্কেলেবল ভেক্টর গ্রাফিক্স (SVG) 10 MB
পোস্টস্ক্রিপ্ট ইমেজ ফরম্যাট (PS) 10 MB
পোর্টেবল ডকুমেন্ট ফরম্যাট (পিডিএফ) 30 এমবি

ওসিআর এই বৈশিষ্ট্যগুলির সাথে ফাইলগুলিতেও কাজ করে:

  • হাতে লেখা নথি। ল্যাটিন লিপি, জাপানি এবং কোরিয়ান ভাষায় নথিগুলি সেরা ফলাফল দেয়৷
  • উল্লম্বভাবে-লিখিত নথি, যেমন জাপানি ভাষায়।
  • ডান-থেকে-বামে-লিখিত নথি, যেমন হিব্রু।