ক্লাউড সার্চ ফাইলের ধরন (MIME বা কন্টেন্ট-টাইপ) নির্বিশেষে পাঠানো সমস্ত আইটেমকে ইন্ডেক্স করে। ইন্ডেক্সিং একটি ফাইলের মেটাডেটা ডেটার উপর এবং, যদি সমর্থিত হয়, এর কন্টেন্টের উপরও করা হয়। নিচে সেইসব ফাইলের ধরনের একটি তালিকা দেওয়া হলো যেগুলোর জন্য কন্টেন্ট ইন্ডেক্সিং সমর্থিত ।
- মাইক্রোসফট ওয়ার্ড (DOC)
- মাইক্রোসফট ওয়ার্ড (DOCX)
- মাইক্রোসফট এক্সেল (XLS)
- মাইক্রোসফট এক্সেল (XLSX)
- মাইক্রোসফট পাওয়ারপয়েন্ট (পিপিটি)
- মাইক্রোসফট পাওয়ারপয়েন্ট (PPTX)
- অ্যাডোবির পোর্টেবল ডকুমেন্ট ফরম্যাট (পিডিএফ)
- রিচ টেক্সট ফরম্যাট (RTF)
- টেক্সট ফরম্যাট (TXT)
- হাইপারটেক্সট মার্কআপ ল্যাঙ্গুয়েজ (HTML)
- প্রসারণযোগ্য মার্কআপ ভাষা (XML)
এই ফাইল প্রকারগুলো ছাড়াও, ক্লাউড সার্চ যেকোনো প্লেইন টেক্সট ফাইলের ভেতরের বিষয়বস্তু ইন্ডেক্স করা সমর্থন করে।
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) ফাইলের প্রকারভেদ এবং বৈশিষ্ট্য
গুগল ক্লাউড সার্চ নিম্নলিখিত ফাইল প্রকারগুলি থেকে টেক্সট বের করার জন্য OCR ব্যবহার করে:
| ফাইলের ধরন | সর্বোচ্চ আকার |
|---|---|
| যৌথ ফটোগ্রাফিক বিশেষজ্ঞ দল (জেপিজি) | ১০ এমবি |
| গ্রাফিক বিনিময় বিন্যাস (GIF) | ১০ এমবি |
| ট্যাগযুক্ত ছবির ফাইল ফরম্যাট (TIFF) | ১০ এমবি |
| স্কেলেবল ভেক্টর গ্রাফিক্স (SVG) | ১০ এমবি |
| পোস্টস্ক্রিপ্ট ইমেজ ফরম্যাট (PS) | ১০ এমবি |
| পোর্টেবল ডকুমেন্ট ফরম্যাট (পিডিএফ) | ৩০ এমবি |
OCR নিম্নলিখিত বৈশিষ্ট্যযুক্ত ফাইলগুলিতেও কাজ করে:
- হাতে লেখা নথি। ল্যাটিন, জাপানি এবং কোরিয়ান লিপিতে লেখা নথি থেকে সবচেয়ে ভালো ফল পাওয়া যায়।
- উল্লম্বভাবে লেখা নথি, যেমন জাপানি ভাষায় লেখা নথি।
- ডান থেকে বামে লেখা নথি, যেমন হিব্রু।