আপনি ক্লাউড সার্চ ডেটাবেস কানেক্টর ব্যবহার করে আপনার প্রতিষ্ঠানের ডেটাবেসগুলো থেকে ডেটা খুঁজে বের করতে ও সূচীবদ্ধ করতে গুগল ক্লাউড সার্চ সেট আপ করতে পারেন।
গুরুত্বপূর্ণ বিবেচ্য বিষয়
আপনি ক্লাউড সার্চ ডেটাবেস কানেক্টরটি প্রায় যেকোনো পরিবেশে ইনস্টল ও রান করতে পারেন যেখানে জাভা অ্যাপ চলতে পারে, তবে শর্ত হলো কানেক্টরটির ইন্টারনেট এবং ডেটাবেস উভয়েরই অ্যাক্সেস থাকতে হবে।
সিস্টেমের প্রয়োজনীয়তা
| সিস্টেমের প্রয়োজনীয়তা | |
|---|---|
| অপারেটিং সিস্টেম | উইন্ডোজ বা লিনাক্স |
| SQL ডাটাবেস | JDBC 4.0 বা তার পরবর্তী সংস্করণের সাথে সামঞ্জস্যপূর্ণ ড্রাইভারসহ যেকোনো SQL ডাটাবেস, যার মধ্যে অন্তর্ভুক্ত:
|
| সফটওয়্যার | JDBC ড্রাইভার (আলাদাভাবে ডাউনলোড এবং ইনস্টল করা) |
কানেক্টরটি স্থাপন করুন
এই ধাপগুলিতে বর্ণনা করা হয়েছে কীভাবে কানেক্টরটি ইনস্টল ও কনফিগার করতে হয়, যাতে এটি আপনার ডেটাবেসগুলিকে ইন্ডেক্স করতে এবং ক্লাউড সার্চ ব্যবহারকারীদের কাছে ফলাফল ফেরত পাঠাতে পারে।
পূর্বশর্ত
কানেক্টরটি স্থাপন করার আগে, এই তথ্যগুলো সংগ্রহ করুন:
- গুগল ওয়ার্কস্পেস প্রাইভেট কী (যার মধ্যে সার্ভিস অ্যাকাউন্ট আইডি থাকে)। ক্লাউড সার্চ এপিআই-তে অ্যাক্সেস কনফিগার করতে দেখুন।
- গুগল ওয়ার্কস্পেস ডেটা সোর্স আইডি। অনুসন্ধানের জন্য ডেটা সোর্স যোগ করুন দেখুন।
ধাপ ১. ডাটাবেস কানেক্টর সফটওয়্যারটি ডাউনলোড এবং বিল্ড করুন।
গিটহাব থেকে কানেক্টর রিপোজিটরিটি ক্লোন করুন।
$ git clone https://github.com/google-cloudsearch/database-connector.git $ cd database-connector
আপনার নির্বাচিত সংস্করণটি দেখুন:
$ git checkout tags/v1-0.0.3
সংযোগকারীটি তৈরি করুন:
টেস্টগুলি এড়িয়ে যেতে,$ mvn package
mvn package -DskipTestsব্যবহার করুন।কানেক্টর জিপ ফাইলটি আপনার ইনস্টলেশন ডিরেক্টরিতে এক্সট্র্যাক্ট করুন:
$ cp target/google-cloudsearch-database-connector-v1-0.0.3.zip installation-dir $ cd installation-dir $ unzip google-cloudsearch-database-connector-v1-0.0.3.zip $ cd google-cloudsearch-database-connector-v1-0.0.3
ধাপ ২. ডাটাবেস কানেক্টর কনফিগার করুন।
connector-config.properties(ডিফল্ট) নামে একটি টেক্সট ফাইল তৈরি করুন। গুগল.propertiesবা.configএক্সটেনশন ব্যবহারের পরামর্শ দেয়। ফাইলটি কানেক্টরের ডিরেক্টরিতেই রাখুন।প্যারামিটারগুলোকে কী-ভ্যালু পেয়ার হিসেবে যোগ করুন। ফাইলটিতে অবশ্যই ডেটা সোর্স অ্যাক্সেস, ডেটাবেস অ্যাক্সেস, একটি সম্পূর্ণ ট্রাভার্সাল SQL স্টেটমেন্ট, একটি কন্টেন্ট ফিল্ড টাইটেল এবং কলাম ডেফিনিশন উল্লেখ করতে হবে।
# Data source access api.sourceId=1234567890abcdef api.identitySourceId=0987654321lmnopq api.serviceAccountPrivateKeyFile=./PrivateKey.json # Database access db.url=jdbc:mysql://localhost:3306/mysql_test db.user=root db.password=passw0rd # Full traversal SQL statement db.allRecordsSql=select customer_id, first_name, last_name, phone from address_book # Column definitions and URL format db.allColumns=customer_id, first_name, last_name, phone db.uniqueKeyColumns=customer_id url.columns=customer_id # Content field contentTemplate.db.title=customer_id # Optional: ACLs defaultAcl.mode=fallback defaultAcl.public=true # Optional: traversal schedule schedule.traversalIntervalSecs=36000 schedule.performTraversalOnStart=trueডাটাবেস-নির্দিষ্ট প্যারামিটারগুলির জন্য, কনফিগারেশন প্যারামিটার রেফারেন্স দেখুন। সাধারণ প্যারামিটারগুলির জন্য, গুগল-সরবরাহকৃত কানেক্টর প্যারামিটারগুলি দেখুন।
ধাপ ৩. ডাটাবেস কানেক্টরটি চালান।
কমান্ড লাইন থেকে কানেক্টরটি চালান:
java -cp "google-cloudsearch-database-connector-v1-0.0.3.jar:mysql-connector-java-5.1.41-bin.jar" com.google.enterprise.cloudsearch.database.DatabaseFullTraversalConnector [-Dconfig=mysql.config]
কানেক্টরটি কনফিগারেশন এবং ইনিশিয়ালাইজেশন ত্রুটি রিপোর্ট করে। অন্যান্য ত্রুটি, যেমন অবৈধ SQL সিনট্যাক্স, তখন দেখা দেয় যখন কানেক্টরটি প্রথমবার ডেটাবেস অ্যাক্সেস করার চেষ্টা করে।
কনফিগারেশন প্যারামিটার রেফারেন্স
এই বিভাগে ডাটাবেস কানেক্টর কনফিগারেশন ফাইলে ব্যবহৃত প্যারামিটারগুলো তালিকাভুক্ত করা হয়েছে।
ডেটা উৎস অ্যাক্সেস প্যারামিটার
| সেটিং | প্যারামিটার |
|---|---|
| ডেটা উৎস আইডি | api.sourceId = source-IDপ্রয়োজনীয় ক্লাউড সার্চ সোর্স আইডি। |
| পরিষেবা অ্যাকাউন্ট | api.serviceAccountPrivateKeyFile = pathপ্রয়োজনীয়। সার্ভিস অ্যাকাউন্ট কী ফাইলের পাথ। |
ডাটাবেস অ্যাক্সেস প্যারামিটার
| সেটিং | প্যারামিটার |
|---|---|
| ডেটাবেস ইউআরএল | db.url = database-URL আবশ্যক। সম্পূর্ণ পাথ, যেমন, |
| যোগ্যতা | db.user = usernamedb.password = passwordআবশ্যক। প্রাসঙ্গিক রেকর্ডগুলো পড়ার অনুমতি প্রয়োজন। |
ট্র্যাভার্সাল SQL কোয়েরি প্যারামিটার
কানেক্টরটি রেকর্ডগুলো পরিভ্রমণ করার জন্য SQL SELECT কোয়েরি ব্যবহার করে।
- সম্পূর্ণ পরিভ্রমণ : কনফিগার করা প্রতিটি রেকর্ড পড়ে। প্রাথমিক ইন্ডেক্সিং এবং পর্যায়ক্রমিক পুনঃ-ইন্ডেক্সিংয়ের জন্য এটি আবশ্যক।
- ক্রমবর্ধমান পরিভ্রমণ : শুধুমাত্র নতুন পরিবর্তিত রেকর্ডগুলো পড়ে। এর জন্য ডাটাবেসে টাইমস্ট্যাম্প ফিল্ড থাকা আবশ্যক।
| সেটিং | প্যারামিটার |
|---|---|
| সম্পূর্ণ ট্রাভার্সাল কোয়েরি | db.allRecordsSql = SELECT columns FROM tableআবশ্যক। কন্টেন্ট, আইডি এবং এসিএল-এর জন্য ব্যবহৃত সমস্ত কলাম অন্তর্ভুক্ত করুন। |
| ক্রমবর্ধমান ট্র্যাভার্সাল কোয়েরি | db.incrementalUpdateSql = SELECT columns FROM table WHERE update_time > ?ইনক্রিমেন্টাল শিডিউলের জন্য আবশ্যক। "?" চিহ্নটি একটি বাধ্যতামূলক টাইমস্ট্যাম্প প্লেসহোল্ডার। |
কলাম সংজ্ঞা পরামিতি
| সেটিং | প্যারামিটার |
|---|---|
| সমস্ত কলাম | db.allColumns = column-1 , column-2 , ...আবশ্যক। SQL কোয়েরিতে উল্লেখিত সমস্ত কলামের তালিকা দেখায়। |
| অনন্য কী কলাম | db.uniqueKeyColumns = column-1আবশ্যক। প্রতিটি রেকর্ডের জন্য অনন্য আইডি নির্ধারণ করে। |
| URL লিঙ্ক কলাম | url.columns = column-1আবশ্যক। ক্লিকযোগ্য অনুসন্ধানের ফলাফলের জন্য ব্যবহৃত কলামটি নির্দিষ্ট করে। |
বিষয়বস্তু ক্ষেত্র
| সেটিং | প্যারামিটার |
|---|---|
| শিরোনাম কলাম | contentTemplate.db.title = column-nameআবশ্যক। সার্চ ইন্ডেক্সিং-এর জন্য সর্বোচ্চ অগ্রাধিকার। |
| অগ্রাধিকার | contentTemplate.db.quality.high = column-1কলামগুলোকে উচ্চ, মাঝারি বা নিম্ন মানের হিসেবে চিহ্নিত করুন। |