একটি ডাটাবেস সংযোগকারী স্থাপন করুন

আপনি ক্লাউড সার্চ ডেটাবেস কানেক্টর ব্যবহার করে আপনার প্রতিষ্ঠানের ডেটাবেসগুলো থেকে ডেটা খুঁজে বের করতে ও সূচীবদ্ধ করতে গুগল ক্লাউড সার্চ সেট আপ করতে পারেন।

গুরুত্বপূর্ণ বিবেচ্য বিষয়

আপনি ক্লাউড সার্চ ডেটাবেস কানেক্টরটি প্রায় যেকোনো পরিবেশে ইনস্টল ও রান করতে পারেন যেখানে জাভা অ্যাপ চলতে পারে, তবে শর্ত হলো কানেক্টরটির ইন্টারনেট এবং ডেটাবেস উভয়েরই অ্যাক্সেস থাকতে হবে।

সিস্টেমের প্রয়োজনীয়তা

সিস্টেমের প্রয়োজনীয়তা
অপারেটিং সিস্টেম উইন্ডোজ বা লিনাক্স
SQL ডাটাবেস JDBC 4.0 বা তার পরবর্তী সংস্করণের সাথে সামঞ্জস্যপূর্ণ ড্রাইভারসহ যেকোনো SQL ডাটাবেস, যার মধ্যে অন্তর্ভুক্ত:
  • এমএস এসকিউএল সার্ভার (২০০৮, ২০১২, ২০১৪, ২০১৬)
  • ওরাকল (11g, 12c)
  • গুগল ক্লাউড এসকিউএল
  • MySQL
সফটওয়্যার JDBC ড্রাইভার (আলাদাভাবে ডাউনলোড এবং ইনস্টল করা)

কানেক্টরটি স্থাপন করুন

এই ধাপগুলিতে বর্ণনা করা হয়েছে কীভাবে কানেক্টরটি ইনস্টল ও কনফিগার করতে হয়, যাতে এটি আপনার ডেটাবেসগুলিকে ইন্ডেক্স করতে এবং ক্লাউড সার্চ ব্যবহারকারীদের কাছে ফলাফল ফেরত পাঠাতে পারে।

পূর্বশর্ত

কানেক্টরটি স্থাপন করার আগে, এই তথ্যগুলো সংগ্রহ করুন:

ধাপ ১. ডাটাবেস কানেক্টর সফটওয়্যারটি ডাউনলোড এবং বিল্ড করুন।

  1. গিটহাব থেকে কানেক্টর রিপোজিটরিটি ক্লোন করুন।

    $ git clone https://github.com/google-cloudsearch/database-connector.git
    $ cd database-connector

  2. আপনার নির্বাচিত সংস্করণটি দেখুন:

    $ git checkout tags/v1-0.0.3

  3. সংযোগকারীটি তৈরি করুন:

    $ mvn package
    টেস্টগুলি এড়িয়ে যেতে, mvn package -DskipTests ব্যবহার করুন।

  4. কানেক্টর জিপ ফাইলটি আপনার ইনস্টলেশন ডিরেক্টরিতে এক্সট্র্যাক্ট করুন:

    $ cp target/google-cloudsearch-database-connector-v1-0.0.3.zip installation-dir
    $ cd installation-dir
    $ unzip google-cloudsearch-database-connector-v1-0.0.3.zip
    $ cd google-cloudsearch-database-connector-v1-0.0.3

ধাপ ২. ডাটাবেস কানেক্টর কনফিগার করুন।

  1. connector-config.properties (ডিফল্ট) নামে একটি টেক্সট ফাইল তৈরি করুন। গুগল .properties বা .config এক্সটেনশন ব্যবহারের পরামর্শ দেয়। ফাইলটি কানেক্টরের ডিরেক্টরিতেই রাখুন।

  2. প্যারামিটারগুলোকে কী-ভ্যালু পেয়ার হিসেবে যোগ করুন। ফাইলটিতে অবশ্যই ডেটা সোর্স অ্যাক্সেস, ডেটাবেস অ্যাক্সেস, একটি সম্পূর্ণ ট্রাভার্সাল SQL স্টেটমেন্ট, একটি কন্টেন্ট ফিল্ড টাইটেল এবং কলাম ডেফিনিশন উল্লেখ করতে হবে।

    # Data source access
    api.sourceId=1234567890abcdef
    api.identitySourceId=0987654321lmnopq
    api.serviceAccountPrivateKeyFile=./PrivateKey.json
    
    # Database access
    db.url=jdbc:mysql://localhost:3306/mysql_test
    db.user=root
    db.password=passw0rd
    
    # Full traversal SQL statement
    db.allRecordsSql=select customer_id, first_name, last_name, phone from address_book
    
    # Column definitions and URL format
    db.allColumns=customer_id, first_name, last_name, phone
    db.uniqueKeyColumns=customer_id
    url.columns=customer_id
    
    # Content field
    contentTemplate.db.title=customer_id
    
    # Optional: ACLs
    defaultAcl.mode=fallback
    defaultAcl.public=true
    
    # Optional: traversal schedule
    schedule.traversalIntervalSecs=36000
    schedule.performTraversalOnStart=true
    

    ডাটাবেস-নির্দিষ্ট প্যারামিটারগুলির জন্য, কনফিগারেশন প্যারামিটার রেফারেন্স দেখুন। সাধারণ প্যারামিটারগুলির জন্য, গুগল-সরবরাহকৃত কানেক্টর প্যারামিটারগুলি দেখুন।

ধাপ ৩. ডাটাবেস কানেক্টরটি চালান।

কমান্ড লাইন থেকে কানেক্টরটি চালান:

java
   -cp "google-cloudsearch-database-connector-v1-0.0.3.jar:mysql-connector-java-5.1.41-bin.jar"
   com.google.enterprise.cloudsearch.database.DatabaseFullTraversalConnector
   [-Dconfig=mysql.config]

কানেক্টরটি কনফিগারেশন এবং ইনিশিয়ালাইজেশন ত্রুটি রিপোর্ট করে। অন্যান্য ত্রুটি, যেমন অবৈধ SQL সিনট্যাক্স, তখন দেখা দেয় যখন কানেক্টরটি প্রথমবার ডেটাবেস অ্যাক্সেস করার চেষ্টা করে।

কনফিগারেশন প্যারামিটার রেফারেন্স

এই বিভাগে ডাটাবেস কানেক্টর কনফিগারেশন ফাইলে ব্যবহৃত প্যারামিটারগুলো তালিকাভুক্ত করা হয়েছে।

ডেটা উৎস অ্যাক্সেস প্যারামিটার

সেটিং প্যারামিটার
ডেটা উৎস আইডি api.sourceId = source-ID

প্রয়োজনীয় ক্লাউড সার্চ সোর্স আইডি।

পরিষেবা অ্যাকাউন্ট api.serviceAccountPrivateKeyFile = path

প্রয়োজনীয়। সার্ভিস অ্যাকাউন্ট কী ফাইলের পাথ।

ডাটাবেস অ্যাক্সেস প্যারামিটার

সেটিং প্যারামিটার
ডেটাবেস ইউআরএল db.url = database-URL

আবশ্যক। সম্পূর্ণ পাথ, যেমন, jdbc:mysql://127.0.0.1/dbname

যোগ্যতা db.user = username
db.password = password

আবশ্যক। প্রাসঙ্গিক রেকর্ডগুলো পড়ার অনুমতি প্রয়োজন।

ট্র্যাভার্সাল SQL কোয়েরি প্যারামিটার

কানেক্টরটি রেকর্ডগুলো পরিভ্রমণ করার জন্য SQL SELECT কোয়েরি ব্যবহার করে।

  • সম্পূর্ণ পরিভ্রমণ : কনফিগার করা প্রতিটি রেকর্ড পড়ে। প্রাথমিক ইন্ডেক্সিং এবং পর্যায়ক্রমিক পুনঃ-ইন্ডেক্সিংয়ের জন্য এটি আবশ্যক।
  • ক্রমবর্ধমান পরিভ্রমণ : শুধুমাত্র নতুন পরিবর্তিত রেকর্ডগুলো পড়ে। এর জন্য ডাটাবেসে টাইমস্ট্যাম্প ফিল্ড থাকা আবশ্যক।
সেটিং প্যারামিটার
সম্পূর্ণ ট্রাভার্সাল কোয়েরি db.allRecordsSql = SELECT columns FROM table

আবশ্যক। কন্টেন্ট, আইডি এবং এসিএল-এর জন্য ব্যবহৃত সমস্ত কলাম অন্তর্ভুক্ত করুন।

ক্রমবর্ধমান ট্র্যাভার্সাল কোয়েরি db.incrementalUpdateSql = SELECT columns FROM table WHERE update_time > ?

ইনক্রিমেন্টাল শিডিউলের জন্য আবশ্যক। "?" চিহ্নটি একটি বাধ্যতামূলক টাইমস্ট্যাম্প প্লেসহোল্ডার।

কলাম সংজ্ঞা পরামিতি

সেটিং প্যারামিটার
সমস্ত কলাম db.allColumns = column-1 , column-2 , ...

আবশ্যক। SQL কোয়েরিতে উল্লেখিত সমস্ত কলামের তালিকা দেখায়।

অনন্য কী কলাম db.uniqueKeyColumns = column-1

আবশ্যক। প্রতিটি রেকর্ডের জন্য অনন্য আইডি নির্ধারণ করে।

URL লিঙ্ক কলাম url.columns = column-1

আবশ্যক। ক্লিকযোগ্য অনুসন্ধানের ফলাফলের জন্য ব্যবহৃত কলামটি নির্দিষ্ট করে।

বিষয়বস্তু ক্ষেত্র

সেটিং প্যারামিটার
শিরোনাম কলাম contentTemplate.db.title = column-name

আবশ্যক। সার্চ ইন্ডেক্সিং-এর জন্য সর্বোচ্চ অগ্রাধিকার।

অগ্রাধিকার contentTemplate.db.quality.high = column-1

কলামগুলোকে উচ্চ, মাঝারি বা নিম্ন মানের হিসেবে চিহ্নিত করুন।