আপনি আপনার গুগল ওয়ার্কস্পেস কন্টেন্টের পাশাপাশি আপনার প্রতিষ্ঠানের মাইক্রোসফট উইন্ডোজ শেয়ারগুলো থেকেও ফলাফল দেখানোর জন্য গুগল ক্লাউড সার্চ সেট আপ করতে পারেন। এর জন্য আপনাকে ক্লাউড সার্চ ফাইল সিস্টেমস কানেক্টর ব্যবহার করতে হবে এবং নির্দিষ্ট উইন্ডোজ শেয়ারগুলো অ্যাক্সেস করার জন্য এটি কনফিগার করতে হবে। একটিমাত্র কানেক্টর ইনস্ট্যান্স একাধিক মাইক্রোসফট উইন্ডোজ শেয়ার সাপোর্ট করতে পারে।
গুরুত্বপূর্ণ বিবেচ্য বিষয়
ফাইল সিস্টেম কানেক্টরটি স্থাপন করার আগে, নিম্নলিখিত বিষয়গুলো পর্যালোচনা করুন।
ক্রমাগত স্বয়ংক্রিয় আপডেট
ডিফল্টরূপে, কানেক্টরটি চালু হওয়ার সময় স্টার্ট পাথগুলো (কনফিগারেশন ফাইলের fs.src থেকে প্রাপ্ত মান) ক্রমাগত মনিটর করে। যখন ফাইল সিস্টেম কন্টেন্ট বা অ্যাক্সেস কন্ট্রোলে কোনো পরিবর্তনের রিপোর্ট করে, তখন কানেক্টরটি ফাইল সিস্টেমটি পুনরায় ক্রল করে। এই পুনঃক্রল প্রক্রিয়াটি রিসোর্স-ইনটেনসিভ হতে পারে। মনিটরিং বন্ধ করতে, fs.monitorForUpdates কে false সেট করুন। এটি রিসোর্স ব্যবহার কমায়, কিন্তু কানেক্টরের পরিবর্তনগুলো প্রতিফলিত হতে বিলম্ব ঘটায়। আরও জানুন
ডিএফএস অ্যাক্সেস নিয়ন্ত্রণ
DFS সিস্টেম তার লিঙ্কগুলিতে অ্যাক্সেস কন্ট্রোল প্রয়োগ করে, এবং সাধারণত প্রতিটি DFS লিঙ্কের নিজস্ব ACL থাকে। একজন ব্যবহারকারীকে দেখানো লিঙ্কগুলি সীমাবদ্ধ করতে DFS অ্যাক্সেস-ভিত্তিক এনুমারেশন (ABE) ব্যবহার করে। যখন ABE হোম ডিরেক্টরিগুলিকে আলাদা করে রাখে, তখন ব্যবহারকারীরা DFS লিঙ্কগুলির শুধুমাত্র একটি উপসেট বা কেবল একটি লিঙ্ক দেখতে পারেন। একটি DFS সিস্টেম অতিক্রম করার সময়, কানেক্টরটি DFS লিঙ্ক ACL এবং টার্গেটের শেয়ার ACL উভয়কেই সম্মান করে; শেয়ার ACL-টি DFS ACL থেকে উত্তরাধিকারসূত্রে প্রাপ্ত হয়।
জ্ঞাত সীমাবদ্ধতা
এই অংশে ফাইল সিস্টেম কানেক্টরের জ্ঞাত সীমাবদ্ধতাগুলো তালিকাভুক্ত করা হয়েছে।
- ফাইল সিস্টেম : এই কানেক্টরটি ম্যাপড বা লোকাল ড্রাইভ সমর্থন করে না।
- ডিস্ট্রিবিউটেড ফাইল সিস্টেম : একটি UNC DFS-এ ম্যাপ করা ড্রাইভ সঠিকভাবে কাজ করে না এবং কিছু ACL সঠিকভাবে পঠিত নাও হতে পারে।
- কানেক্টরটি DFS নেমস্পেস এবং লিঙ্ক সমর্থন করে, কিন্তু DFS নেমস্পেসের অন্তর্গত সাধারণ ফোল্ডার সমর্থন করে না।
-
cloudsearch.google.comএ থাকা বা Query API দ্বারা প্রাপ্ত ফাইল লিঙ্কগুলো বেশিরভাগ ব্রাউজারে ক্লিকযোগ্য নয়।
সিস্টেমের প্রয়োজনীয়তা
ফাইল সিস্টেম কানেক্টরটি স্থাপন করার আগে, নিশ্চিত করুন যে হোস্ট মেশিনটি নিম্নলিখিত শর্তগুলো পূরণ করে:
| সিস্টেমের প্রয়োজনীয়তা | |
|---|---|
| অপারেটিং সিস্টেম |
|
| সফটওয়্যার |
|
| ফাইল সিস্টেম প্রোটোকল |
সমর্থিত নয়: স্থানীয় উইন্ডোজ ফাইল সিস্টেম, NFS 2.0, NFS 3.0, বা স্থানীয় লিনাক্স ফাইল সিস্টেম। |
কানেক্টরটি স্থাপন করুন
ফাইল সিস্টেম কানেক্টরটি স্থাপন করতে এই ধাপগুলো অনুসরণ করুন।
পূর্বশর্ত
কানেক্টরটি স্থাপন করার আগে, নিশ্চিত করুন যে আপনার পরিবেশে নিম্নলিখিত উপাদানগুলো রয়েছে:
সংযোগ স্থাপনের জন্য গুগল ওয়ার্কস্পেস সম্পর্কিত তথ্য:
- গুগল ওয়ার্কস্পেস প্রাইভেট কী (যার মধ্যে সার্ভিস অ্যাকাউন্ট আইডি থাকে)। ক্লাউড সার্চ এপিআই-তে অ্যাক্সেস কনফিগার করতে দেখুন।
- গুগল ওয়ার্কস্পেস ডেটা সোর্স আইডি। অনুসন্ধানের জন্য ডেটা সোর্স যোগ করুন দেখুন।
- একটি আইডেন্টিটি সোর্স আইডি। আইডেন্টিটি সোর্স তৈরি করুন দেখুন। আপনি যদি অ্যাক্টিভ ডিরেক্টরির সাথে সিঙ্ক করেন, তাহলে GCDS ব্যবহার করুন।
আপনার গুগল ওয়ার্কস্পেস অ্যাডমিনিস্ট্রেটর সাধারণত এই ক্রেডেনশিয়ালগুলো সরবরাহ করতে পারেন।
নিশ্চিত করুন যে উইন্ডোজ অ্যাকাউন্টটির পর্যাপ্ত অনুমতি রয়েছে।
প্রয়োজনীয় মাইক্রোসফট উইন্ডোজ অ্যাকাউন্টের অনুমতি
কানেক্টরটি পরিচালনাকারী উইন্ডোজ অ্যাকাউন্টের নিম্নলিখিত অনুমতিগুলো অবশ্যই থাকতে হবে:
- ফোল্ডারের বিষয়বস্তু তালিকাভুক্ত করুন।
- নথির বিষয়বস্তু পড়ুন।
- ফাইল এবং ফোল্ডারের বৈশিষ্ট্যগুলো পড়ুন।
- ফাইল ও ফোল্ডারের জন্য পঠন অনুমতি (ACL)।
- মৌলিক বৈশিষ্ট্যগুলো লিখুন।
এই গোষ্ঠীগুলির মধ্যে কোনো একটির সদস্যপদ সাধারণত পর্যাপ্ত অনুমতি প্রদান করে: অ্যাডমিনিস্ট্রেটর, পাওয়ার ইউজার, প্রিন্ট অপারেটর বা সার্ভার অপারেটর।
ধাপ ১. সংযোগকারীটি ইনস্টল করুন।
গিটহাব থেকে কানেক্টর রিপোজিটরিটি ডাউনলোড বা ক্লোন করুন, এবং তারপর কানেক্টর প্যাকেজটি বিল্ড করুন।
গিটহাব থেকে কানেক্টর রিপোজিটরিটি ডাউনলোড করে বিল্ড করুন।
উইন্ডোজ সার্ভারে গিট ব্যবহার করতে:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector > git checkout tags/v1-0.0.3
সরাসরি ডাউনলোড করতে:
- windows-filesystems-connector- এ যান।
- ক্লোন বা ডাউনলোড-এ ক্লিক করুন > জিপ ডাউনলোড করুন ।
- প্যাকেজটি আনজিপ করুন এবং ডিরেক্টরিতে যান।
অ্যাপাচি মেভেন ব্যবহার করে কানেক্টরটি তৈরি করুন:
টেস্টগুলি এড়িয়ে যেতে,> mvn package
mvn package -DskipTestsব্যবহার করুন।কানেক্টর জিপ ফাইলটি আপনার ইনস্টলেশন ডিরেক্টরিতে এক্সট্র্যাক্ট করুন:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
ধাপ ২. কনফিগারেশন ফাইলটি তৈরি করুন।
কানেক্টরটি ইনস্টল করার পর, একটি কনফিগারেশন ফাইল তৈরি করুন যাতে কানেক্টরটির সেটিংস থাকবে।
- কানেক্টর ডিরেক্টরিতে
connector-config.propertiesনামে একটি ফাইল তৈরি করুন। প্যারামিটারগুলো কী-ভ্যালু পেয়ার হিসেবে যোগ করুন। উদাহরণস্বরূপ:
# Required parameters api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # File system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace # Optional parameters traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWEDফাইল-সিস্টেম-নির্দিষ্ট প্যারামিটারগুলোর জন্য কনফিগারেশন প্যারামিটার রেফারেন্স দেখুন। সমস্ত ক্লাউড সার্চ কানেক্টর দ্বারা ব্যবহৃত সাধারণ প্যারামিটারগুলোর তালিকার জন্য, গুগল-সরবরাহকৃত কানেক্টর প্যারামিটারসমূহ দেখুন।
ধাপ ৩. লগিং সক্ষম করুন
লগের জন্য একটি ডিরেক্টরি এবং একটি লগিং কনফিগারেশন ফাইল তৈরি করুন।
- কানেক্টর ডিরেক্টরিতে
logsনামে একটি ফোল্ডার তৈরি করুন। logging.propertiesনামে একটি ফাইল তৈরি করুন এবং তাতে নিম্নলিখিত বিষয়বস্তু রাখুন:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
ধাপ ৪. (ঐচ্ছিক) মিডিয়ার প্রকারভেদ কনফিগার করুন
কানেক্টরটি তার ডিফল্ট পদ্ধতি ব্যবহার করে ফাইলের মিডিয়া টাইপ শনাক্ত করার চেষ্টা করে, যা উইন্ডোজে রেজিস্ট্রি এন্ট্রির উপর নির্ভর করে। যদি কোনো ফাইল এক্সটেনশনের জন্য রেজিস্ট্রি এন্ট্রি না থাকে, তাহলে কানেক্টরটি মিডিয়া টাইপটি সঠিকভাবে শনাক্ত করতে ব্যর্থ হতে পারে। যদি মিডিয়া টাইপগুলো সঠিকভাবে শনাক্ত না হয়, অথবা আপনি যদি কোনো এক্সটেনশনের জন্য ডিফল্ট টাইপটি পরিবর্তন করতে চান, তাহলে এই ধাপগুলো অনুসরণ করুন:
- connector ডিরেক্টরিতে
mime-type.propertiesনামে একটি ফাইল তৈরি করুন। - এক্সটেনশন এবং টাইপগুলি
extension=media/type:properties xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
ধাপ ৫. ফাইল সিস্টেম কানেক্টরটি চালান।
হোস্ট মেশিন থেকে কানেক্টরটি চালু করুন:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config] ডিফল্টরূপে, কানেক্টরটি যে ডিরেক্টরিতে চালানো হয়, সেখানে connector-config.properties নামের একটি কনফিগারেশন ফাইল খোঁজে। যদি আপনার কনফিগারেশন ফাইলের নাম ভিন্ন হয় বা এটি অন্য কোনো ডিরেক্টরিতে থাকে, তবে এর পাথ নির্দিষ্ট করতে -Dconfig প্যারামিটারটি ব্যবহার করুন।
কনফিগারেশন প্যারামিটার রেফারেন্স
নিম্নলিখিত সারণিগুলিতে ফাইল সিস্টেম কানেক্টর কনফিগার করতে ব্যবহৃত প্যারামিটারগুলির তালিকা ও বর্ণনা দেওয়া হয়েছে।
ডেটা উৎস অ্যাক্সেস
| সেটিং | প্যারামিটার |
| ডেটা উৎস আইডি | api.sourceId= 1234567890abcdefপ্রয়োজনীয় ক্লাউড সার্চ সোর্স আইডি। |
| পরিষেবা অ্যাকাউন্ট | api.serviceAccountPrivateKeyFile= ./PrivateKey.jsonপ্রয়োজনীয়। সার্ভিস অ্যাকাউন্ট কী ফাইলের পাথ। |
| পরিচয় উৎস আইডি | api.identitySourceId= x0987654321প্রয়োজনীয়। GCDS ব্যবহার করে অ্যাক্টিভ ডিরেক্টরি আইডেন্টিটি সিঙ্ক করার জন্য Google Workspace অ্যাডমিনিস্ট্রেটর দ্বারা সেট আপ করা ক্লাউড সার্চ আইডেন্টিটি সোর্স আইডি। |
ফাইল সিস্টেম অ্যাক্সেস
ক্রল করার জন্য ফাইল সিস্টেম সোর্সগুলো নির্দিষ্ট করতে এই প্যারামিটারগুলো ব্যবহার করুন।
| সেটিং | প্যারামিটার |
| উৎস ফাইল সিস্টেম | fs.src= path1 [, path2 , ...] আবশ্যক। উৎস ফাইল সিস্টেম হিসেবে এক বা একাধিক UNC উৎস নির্দিষ্ট করুন, যা |
পথ বিভাজক অক্ষর
| সেটিং | প্যারামিটার |
| পথ বিভাজক অক্ষর | fs.src.separator= separator-characterডিফল্ট বিভাজক হলো সেমিকোলন (;)। যদি আপনার সোর্স পাথে সেমিকোলন থাকে, তাহলে আপনি একটি ভিন্ন ডিলিমিটার, যেমন কমা (","), সেট করতে পারেন, যা আপনার পাথের অক্ষরগুলির সাথে সাংঘর্ষিক নয় এবং প্রপার্টি ফাইলের সিনট্যাক্স দ্বারা সংরক্ষিত নয়। যদি |
সংযোগকারী আচরণ
কানেক্টরটি কীভাবে ফাইল সিস্টেম ক্রল করবে তা নিয়ন্ত্রণ করতে এই প্যারামিটারগুলো ব্যবহার করুন।
| সেটিং | প্যারামিটার |
| উইন্ডোজ ডোমেইন | fs.supportedDomain= domainGCDS- এ সেট আপ করা ব্যবহারকারীদের ক্লাউড সার্চের মাধ্যমে ডকুমেন্ট অ্যাক্সেস করার সুযোগ দেওয়ার জন্য এটি প্রয়োজন। অ্যাক্টিভ ডিরেক্টরির একটি একক NetBIOS ডোমেইন নাম হিসাবে এটি নির্দিষ্ট করুন। |
| ACLS-এ অ্যাকাউন্ট অন্তর্ভুক্ত করুন | fs.supportedAccounts= account-1[, account-2,...]বিল্ট-ইন অ্যাকাউন্ট হোক বা না হোক, ACL-এ অন্তর্ভুক্ত করার জন্য অ্যাকাউন্টগুলোর একটি কমা-বিভক্ত তালিকা। ডিফল্ট মান হলো |
| ACL থেকে বিল্ট-ইন অ্যাকাউন্ট বাদ দিন | fs.builtinGroupPrefix= prefixবিল্ট-ইন অ্যাকাউন্টগুলির প্রিফিক্স নির্দিষ্ট করুন। যে অ্যাকাউন্ট এই প্রিফিক্স দিয়ে শুরু হয়, সেটিকে একটি বিল্ট-ইন অ্যাকাউন্ট হিসেবে গণ্য করা হবে এবং ACL থেকে বাদ দেওয়া হবে। ডিফল্ট মান হল |
| লুকানো ফাইল ও ফোল্ডারের ইন্ডেক্সিং-এর অনুমতি দিন | fs.crawlHiddenFiles= boolean লুকানো ফাইল ক্রল করতে এটিকে ' |
| ক্রল করা ফোল্ডার তালিকা এবং ডিএফএস নেমস্পেস গণনার সূচীকরণের অনুমতি দিন | fs.indexFolders= boolean যখন এটি ' |
| ফাইল সিস্টেম পরিবর্তন পর্যবেক্ষণ সক্ষম করুন | fs.monitorForUpdates= boolean যখন এটি |
| ডিরেক্টরিগুলোর ক্যাশের সর্বোচ্চ আকার নির্ধারণ করুন। | fs.directoryCacheSize= number-of-entriesডিরেক্টরি ক্যাশের সর্বোচ্চ আকার। কানেক্টরটি লুকানো ফোল্ডার শনাক্ত করতে এই ক্যাশ ব্যবহার করে, যাতে লুকানো ফোল্ডারের ভেতরের ফাইল ও ফোল্ডারগুলোকে ইন্ডেক্স করা এড়ানো যায়। ডিফল্টভাবে ৫০,০০০ এন্ট্রি থাকে, যা সাধারণত ১০-১৫ মেগাবাইট র্যাম ব্যবহার করে। |
টাইমস্ট্যাম্প সংরক্ষণ
কানেক্টরটি কীভাবে টাইমস্ট্যাম্প সংরক্ষণ করবে তা নির্দিষ্ট করতে এই প্যারামিটারগুলো ব্যবহার করুন।
| সেটিং | প্যারামিটার |
| প্রবেশের সময় সংরক্ষণ করুন | fs.preserveLastAccessTime= valueফাইল ও ফোল্ডার ক্রল করার সময়, কানেক্টর সেগুলোর শেষ অ্যাক্সেস টাইমস্ট্যাম্প পরিবর্তন করে ক্রলের সময়টি নির্ধারণ করে দিতে পারে। যদি শেষ অ্যাক্সেসের সময় সংরক্ষিত না থাকে, তাহলে ব্যাকআপ এবং আর্কাইভ সিস্টেমগুলো উপযুক্ত ফাইল ও ফোল্ডারগুলোকে সেকেন্ডারি স্টোরেজে স্থানান্তর নাও করতে পারে, কারণ কানেক্টর সেগুলোতে অ্যাক্সেস করেছে। ডিফল্টরূপে, সম্ভাব্য মানগুলো হলো:
|
| শুধুমাত্র একটি নির্দিষ্ট তারিখের পরে অ্যাক্সেস করা ফাইলগুলি ক্রল করুন। | fs.lastAccessedDate= YYYY-MM-DD শুধুমাত্র তখনই কন্টেন্ট ক্রল করুন, যদি শেষ অ্যাক্সেসের সময় নির্দিষ্ট তারিখের (YYYY-MM-DD, ISO8601 ফরম্যাট) পরে হয়। ডিফল্টরূপে এটি |
| শুধুমাত্র বিগত কয়েক দিনের মধ্যে অ্যাক্সেস করা ফাইলগুলো ক্রল করুন। | fs.lastAccessedDays= number-of-days শুধুমাত্র তখনই কন্টেন্ট ক্রল করুন, যদি শেষ অ্যাক্সেসের সময় বর্তমান থেকে নির্দিষ্ট সংখ্যক দিনের মধ্যে হয়। ডিফল্টরূপে এটি |
| শুধুমাত্র একটি নির্দিষ্ট তারিখের পরে পরিবর্তিত ফাইলগুলো ক্রল করুন। | fs.lastModifiedDate= YYYY-MM-DD শুধুমাত্র তখনই কন্টেন্ট ক্রল করুন, যদি শেষ পরিবর্তনের সময় নির্দিষ্ট তারিখের (YYYY-MM-DD, ISO8601 ফরম্যাট) পরের হয়। ডিফল্টরূপে এটি |
| শুধুমাত্র সেই ফাইলগুলো ক্রল করুন যেগুলো বিগত কয়েক দিনের মধ্যে পরিবর্তন করা হয়েছে। | fs.lastModifiedDays= number-of-days শুধুমাত্র তখনই কন্টেন্ট ক্রল করুন, যদি শেষ পরিবর্তনের সময় বর্তমান থেকে নির্দিষ্ট সংখ্যক দিনের মধ্যে হয়। ডিফল্টরূপে এটি |
ফাইল শেয়ার ACL এড়িয়ে যান
আপনি কানেক্টরটিকে এমনভাবে সেট করতে পারেন যাতে শেয়ার ACL পড়ার অনুমতি না থাকলে এটি সেগুলোকে উপেক্ষা করে। তখন কন্টেন্টটি একটি অনুমতিমূলক শেয়ার ACL সহ ফেরত দেওয়া হয়।
| সেটিং | প্যারামিটার |
| শেয়ার ACL এড়িয়ে যান | fs.skipShareAccessControl= boolean শেয়ার ACL উপেক্ষা করতে এটিকে ' |