কনফিগারেশন ফাইল সহ প্রোগ্রামেবল সার্চ ইঞ্জিন তৈরি করা

এই পৃষ্ঠাটি প্রোগ্রামেবল সার্চ ইঞ্জিন কনফিগারেশন ফাইলের পিছনে মৌলিক ধারণাগুলি উপস্থাপন করে।

  1. ওভারভিউ
  2. প্রোগ্রামেবল সার্চ ইঞ্জিনে কী থাকে
  3. কিভাবে উপাদান একসাথে কাজ
  4. একটি সার্চ ইঞ্জিন তৈরি করা
  5. প্রোগ্রামেবল সার্চ ইঞ্জিন ফাইল সম্পাদনা করা
  6. সঠিক বিন্যাস নির্বাচন করা হচ্ছে

ওভারভিউ

যদি কন্ট্রোল প্যানেল আপনাকে আপনার প্রয়োজনীয় কাস্টমাইজেশনের স্তর না দেয়, তাহলে প্রোগ্রামেবল অনুসন্ধান XML ফর্ম্যাট ব্যবহার করার কথা বিবেচনা করুন, যা আপনাকে আরও বেশি নিয়ন্ত্রণ, নমনীয়তা এবং আরও শক্তিশালী বৈশিষ্ট্যগুলিতে অ্যাক্সেস দেয়।

প্রোগ্রামেবল সার্চ ইঞ্জিন কনফিগারেশন ফাইল ব্যবহার করতে, প্রোগ্রামেবল সার্চ ইঞ্জিন কন্ট্রোল প্যানেল ব্যবহার করে একটি মৌলিক সার্চ ইঞ্জিন তৈরি করে শুরু করুন। একবার আপনি আপনার সার্চ ইঞ্জিন তৈরি করলে, আপনি কন্ট্রোল প্যানেলের ওভারভিউ পৃষ্ঠা থেকে আপনার টীকা এবং প্রসঙ্গ XML ফাইল ডাউনলোড করতে পারেন।

XML বেসিক

এক্সটেনসিবল মার্কআপ ল্যাঙ্গুয়েজ বা XML হল একটি সাধারণ-উদ্দেশ্য মার্কআপ ভাষা। এটি ট্যাগ সহ পাঠ্য যা আপনি পড়তে পারেন। উদাহরণস্বরূপ, প্রোগ্রামেবল অনুসন্ধান XML ফর্ম্যাটে নিম্নলিখিত ট্যাগগুলি অন্তর্ভুক্ত রয়েছে: <Context> </Context> এবং <LookAndFeel> </LookAndFeel>

যেকোনো XML ফাইলের মতো, আপনার প্রোগ্রামেবল সার্চ ইঞ্জিনের স্পেসিফিকেশন অবশ্যই XML সিনট্যাক্স ( <element attribute="value">content</element> ) অনুসরণ করবে এবং সুগঠিত হতে হবে। XML এর নিম্নলিখিত নিয়ম রয়েছে:

  • XML-এর জন্য আপনাকে একটি XML ঘোষণা ( <?xml version="1.0"?> ) সহ আপনার শীর্ষ-স্তরের ট্যাগগুলিকে আগে দিতে হবে, কিন্তু প্রোগ্রামেবল সার্চ ইঞ্জিন কনফিগারেশন ফাইলের প্রয়োজন নেই৷
  • আপনার সমস্ত উপাদানের একটি খোলার ট্যাগ ( <tag> ) এবং একটি ক্লোজিং ট্যাগ ( </tag> ) থাকতে হবে।
  • আপনার সব ট্যাগ সঠিকভাবে নেস্ট করা আবশ্যক. আপনার কাছে এইরকম XML কোড থাকতে পারে না: <sandwich><filling> peanut butter</sandwich></filling> । পরিবর্তে, এটি এরকম হওয়া উচিত: <sandwich><filling> peanut butter</filling></sandwich>
  • XML কেস-সংবেদনশীল, তাই নির্দেশাবলীতে ট্যাগগুলির ক্যাপিটালাইজেশন এবং বানান সাবধানে অনুসরণ করুন৷
  • সমস্ত অ্যাট্রিবিউট মান অবশ্যই ডবল উদ্ধৃতি চিহ্নে আবদ্ধ থাকতে হবে ( <element attribute="value"> )।
  • সমস্ত বৈশিষ্ট্য অবশ্যই খোলার ট্যাগে সংজ্ঞায়িত করা উচিত ( <element attribute="value"> ), ক্লোজিং ট্যাগ ( </element> ) নয়।

আপনি মন্তব্য ট্যাগ ব্যবহার করে নিজের জন্য নোট লিখতে পারেন ( <!-- your comment here --> ), এবং প্রোগ্রামেবল সার্চ ইঞ্জিন XML কোড হিসাবে পাঠ্যের সেই লাইনটিকে পার্স করবে না। অনুস্মারক বা বিবরণ লেখা ছাড়াও, আপনি কিছু এক্সএমএল কোড অস্থায়ীভাবে কমিশনের বাইরে রাখার জন্য মন্তব্য ব্যবহার করতে পারেন (সম্ভবত আপনি নির্দিষ্ট প্রভাবগুলির সাথে পরীক্ষা করতে চান বা আপনি সমস্যাগুলি সমাধান করতে চান)। যাইহোক, এই মন্তব্যগুলি আপনি কন্ট্রোল প্যানেল থেকে ডাউনলোড করা ফাইলগুলিতে সংরক্ষিত নয়৷ আপনি যদি মন্তব্য রাখতে চান, তাহলে কন্ট্রোল প্যানেলে আপলোড করার পরেও আপনার মন্তব্য করা XML ফাইলগুলির একটি অনুলিপি রাখা উচিত৷

আপনি XML ফাইল তৈরি এবং সম্পাদনা করতে একটি সাধারণ পাঠ্য সম্পাদক ব্যবহার করতে পারেন। শুধু ফাইল এক্সটেনশন .xml দিয়ে টেক্সট ফাইল সংরক্ষণ করুন (উদাহরণস্বরূপ, cse_badminton.xml )।

উপরে ফিরে যান

প্রোগ্রামেবল সার্চ ইঞ্জিনে কী থাকে

একটি প্রোগ্রামেবল সার্চ ইঞ্জিনের দুটি প্রধান উপাদান রয়েছে, যার প্রতিটি একটি XML ফাইল দ্বারা নিয়ন্ত্রিত হয়:

  • প্রসঙ্গ : প্রসঙ্গ XML ফাইল একটি সার্চ ইঞ্জিনের মৌলিক বৈশিষ্ট্য বর্ণনা করে। এটি সার্চ ইঞ্জিনের গ্লোবাল সেটিংস নির্দিষ্ট করে, যেমন ইমেজ সার্চ বা প্রচারগুলি সক্ষম কিনা। প্রতিটি সার্চ ইঞ্জিনের নিজস্ব প্রসঙ্গ ফাইল রয়েছে। প্রসঙ্গ XML ফাইল সম্পর্কে আরও তথ্য। আপনার সার্চ ইঞ্জিনের জন্য সবচেয়ে উপযুক্ত ফাইল বিন্যাস নির্বাচন করার বিষয়ে আরও তথ্যের জন্য, আপনার অনুসন্ধান ইঞ্জিনের জন্য সঠিক বিন্যাস নির্বাচন করা দেখুন।
  • টীকা : টীকা XML ফাইলটি আপনার সার্চ ইঞ্জিনকে কভার করতে চান এমন ওয়েবপৃষ্ঠা বা ওয়েবসাইটগুলিকে তালিকাভুক্ত করে এবং এই সাইটগুলিকে আপনার অনুসন্ধানের ফলাফলে কীভাবে স্থান দেওয়া উচিত সে সম্পর্কে আপনার কোন পছন্দগুলি নির্দেশ করে৷ প্রতিটি সাইট এবং এর সাথে সম্পর্কিত তথ্যকে একটি টীকা বলা হয়। টীকা XML ফাইল সম্পর্কে আরো তথ্য.

আমরা সুপারিশ করি না যে আপনি স্ক্র্যাচ থেকে এই ফাইলগুলির মধ্যে একটি তৈরি করুন৷ পরিবর্তে, কন্ট্রোল প্যানেলের ওভারভিউ পৃষ্ঠা থেকে এগুলি ডাউনলোড করুন।

এই প্রধান উপাদানগুলি ছাড়াও, একটি অনুসন্ধান ইঞ্জিনে নিম্নলিখিত সহায়ক ফাইলগুলিও থাকতে পারে:

  • প্রচার : প্রচারের XML ফাইলটি কাস্টম ফলাফলের একটি সিরিজ তালিকাভুক্ত করে যা পূর্ব-নির্ধারিত ক্যোয়ারী পদের সেট দ্বারা ট্রিগার করা হয়। যখন একজন ব্যবহারকারী একটি অনুসন্ধান টাইপ করে যা আপনার প্রশ্নের একটি শব্দের সাথে হুবহু মেলে, প্রচারটি পৃষ্ঠার শীর্ষে প্রদর্শিত হয়৷ আপনি প্রচারগুলি ব্যবহার করতে পারেন সরাসরি আপনার ব্যবহারকারীদের প্রশ্নের উত্তর দিতে, তাদের গুরুত্বপূর্ণ তথ্যের দিকে নিয়ে যেতে, বা ফলাফল পৃষ্ঠার শীর্ষে নেই এমন ওয়েবপৃষ্ঠাগুলিতে নির্দেশ করতে পারেন যা এখনও বিশেষভাবে প্রাসঙ্গিক৷ কন্ট্রোল প্যানেলে, প্রচারগুলি প্রচার ট্যাবে সংজ্ঞায়িত করা হয়৷ প্রচার সম্পর্কে আরো তথ্য.
  • সমার্থক শব্দ : প্রতিশব্দ XML ফাইলটি অনুসন্ধান শব্দের রূপগুলি অন্তর্ভুক্ত করতে আপনার ব্যবহারকারীদের প্রশ্নগুলিকে প্রসারিত করে৷ উদাহরণস্বরূপ, যদি আপনার ব্যবহারকারী "সিমিয়ান" অনুসন্ধান করে, অনুসন্ধান ইঞ্জিনটি "বানর" এবং "বানর" অনুসন্ধান করে। কন্ট্রোল প্যানেলে, প্রতিশব্দ ট্যাবে সংজ্ঞায়িত করা হয়। সমার্থক শব্দ সম্পর্কে আরো তথ্য.

কিভাবে উপাদান একসাথে কাজ

প্রসঙ্গ XML ফাইলটি ব্যবহার করার জন্য টীকা ফাইলটি নির্দিষ্ট করে না এবং টীকা XML প্রসঙ্গ ফাইলের কোন উল্লেখ করে না। প্রোগ্রামেবল সার্চ ইঞ্জিন প্রসঙ্গ এবং টীকা সংযুক্ত করতে লেবেল ব্যবহার করে। কনটেক্সট এক্সএমএল ফাইলটিতে লেবেল রয়েছে যা সার্চ ইঞ্জিনকে শনাক্ত করে, এবং অ্যানোটেশন XML-এ তালিকাভুক্ত প্রতিটি টীকাকে এক বা একাধিক লেবেল দিয়ে ট্যাগ করা হয় যা এটির সাথে সম্পর্কিত সার্চ ইঞ্জিনকে শনাক্ত করে৷ যদি আপনি প্রসঙ্গে লেবেলের নাম পরিবর্তন করেন ফাইল, আপনাকে সেই লেবেলের সাথে ট্যাগ করা সমস্ত টীকা পরিবর্তন করতে হবে।

যদিও আপনি একাধিক টীকা ফাইল আপলোড করতে পারেন, আপনি যখন কন্ট্রোল প্যানেলের মাধ্যমে ডাউনলোড করেন, প্রোগ্রামেবল সার্চ ইঞ্জিন আপনার সমস্ত টীকা ফাইলকে একটি একক টীকা ফাইলে একত্রিত করে। টীকা ফাইল বিভিন্ন সার্চ ইঞ্জিনের জন্য একই সাইট কাস্টমাইজ করার নমনীয়তা প্রদান করে। উদাহরণস্বরূপ, একটি সার্চ ইঞ্জিন তার অনুসন্ধানকে কিছু সাইটে সীমাবদ্ধ করতে পারে, অন্যটি সেই সাইটগুলিকে বাদ দিতে পারে এবং অন্যটি সেই সাইটগুলিকে প্রচার করতে পারে৷

context.xml

এখানে একটি context.xml ফাইলের একটি উদাহরণ রয়েছে যেখানে এটি প্রযোজ্য সার্চ ইঞ্জিন সনাক্তকারী লেবেল রয়েছে:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

এখানে একটি টীকা ফাইলের একটি উদাহরণ রয়েছে যা দেখায় কিভাবে প্রতিটি সাইট (টীকা) একটি লেবেলের সাথে যুক্ত:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

উপরে ফিরে যান

উন্নত প্রোগ্রামেবল সার্চ ইঞ্জিন তৈরি করা

উন্নত ইঞ্জিন তৈরি করতে নিম্নলিখিত পদক্ষেপগুলি জড়িত:

  1. আপনার প্রয়োজনের জন্য উপযুক্ত বিন্যাস নির্ধারণ করুন
  2. আপনার সার্চ ইঞ্জিনের স্পেসিফিকেশন নির্ধারণ করুন
  3. প্রোগ্রামেবল সার্চ ইঞ্জিনকে বলুন কোন সাইটগুলো সার্চ করতে হবে
  4. প্রোগ্রামেবল সার্চ ইঞ্জিনকে বলুন কিভাবে সার্চ রেজাল্ট র‍্যাঙ্ক করতে হয়

প্রোগ্রামেবল সার্চ ইঞ্জিন ফাইল সম্পাদনা করা

একটি XML ফাইলে কাজ করতে, কন্ট্রোল প্যানেলের ওভারভিউ পৃষ্ঠা থেকে XML স্পেসিফিকেশন ডাউনলোড করুন। স্ক্র্যাচ থেকে একটি ফাইল শুরু করবেন না. নিম্নলিখিতগুলি করুন:

  1. কন্ট্রোল প্যানেলের ওভারভিউ পৃষ্ঠা থেকে প্রসঙ্গ ফাইল বা টীকা ফাইল ডাউনলোড করুন। অনুসন্ধান বৈশিষ্ট্য বিভাগে ডাউনলোড বোতামে ক্লিক করুন।
  2. একটি টেক্সট এডিটর ব্যবহার করুন যা UNIX-শৈলীর লাইন শেষ করতে পারে (WordPad, Emacs, এবং TextMate কাজ করে; NotePad করে না)। আপনি ফাইলের নাম কী রাখবেন তা বিবেচ্য নয়, যতক্ষণ না আপনি ফাইল এক্সটেনশন .xml দিয়ে সংরক্ষণ করেন (উদাহরণস্বরূপ, cx_global.xml )
  3. ডাউনলোড করা ফাইলের একটি ব্যাকআপ কপি তৈরি করুন যদি আপনার সম্পাদিত সংস্করণ আশানুরূপ কাজ না করে এবং আপনাকে পূর্ববর্তী সংস্করণে ফিরে যেতে হবে।

    আপনি যদি একটি অনুলিপি তৈরি না করেন এবং আপনার সম্পাদনা করা সংস্করণটি সঠিকভাবে কাজ না করে, তাহলে আপনাকে আপনার ফাইলটি ডিবাগ করতে হবে বা আপনার সার্চ ইঞ্জিনকে আবার নতুন করে তৈরি করতে হবে৷ মজা না.

  4. XML ফাইলটি সম্পাদনা করুন এবং এটি সংরক্ষণ করুন। নিশ্চিত করুন যে আপনার টেক্সট এডিটর ফাইলটি ইউনিকোড টেক্সট ডকুমেন্ট হিসাবে সংরক্ষণ করছে এবং অন্য কোন ফাইল ফরম্যাট নয়।
  5. ওভারভিউ পৃষ্ঠায় অনুসন্ধান বৈশিষ্ট্য বিভাগের অধীনে ফাইলটি আপলোড করুন৷

সঠিক বিন্যাস নির্বাচন করা হচ্ছে

আপনি আপনার প্রোগ্রামেবল সার্চ ইঞ্জিন তৈরি করা শুরু করার আগে, কোন ফর্ম্যাটটি আপনার প্রয়োজনে সবচেয়ে উপযুক্ত তা নির্ধারণ করুন। আপনি এমন একটি বিন্যাস নির্বাচন করতে চান না যা আপনার প্রয়োজনের চেয়ে বেশি শক্তিশালী এবং জটিল, বা আপনি এমন একটি ব্যবহার করতে চান না যা আপনি দ্রুত বৃদ্ধি পাবে।

উপযুক্ত বিন্যাস বাছাই করতে নিম্নলিখিত টেবিলটি ব্যবহার করুন।

তৈরি করতে ব্যবহার করুন কারণ সীমাবদ্ধতা আরও তথ্য
অল্প সংখ্যক সাইট সহ এক বা কয়েকটি সার্চ ইঞ্জিন কন্ট্রোল প্যানেল আপনি টেক্সট এডিটর দিয়ে ফাইল তৈরি করে ফাইল আপলোড করার পরিবর্তে টেক্সট বক্স পূরণ করে দ্রুত আপনার প্রোগ্রামেবল সার্চ ইঞ্জিন তৈরি করতে পারেন। কন্ট্রোল প্যানেল বেশিরভাগই প্রোগ্রামেবল সার্চ ইঞ্জিনের সাথে নিজেকে পরিচিত করার জন্য এবং কয়েকটি সাইট দিয়ে সার্চ ইঞ্জিন তৈরি করার জন্য উপযোগী। শুরু করা
জটিল সার্চ ইঞ্জিন যা প্রচুর সাইট ব্যবহার করে, ফিড ব্যবহার করে প্রসঙ্গ ফাইল এবং টীকা ফাইল

প্রোগ্রামেবল সার্চ ইঞ্জিন ফাইলগুলি আপনাকে আপনার সার্চ ইঞ্জিনগুলির উপর একটি বৃহত্তর স্তরের নিয়ন্ত্রণ দেয় এবং সাইটগুলিকে সংজ্ঞায়িত এবং পরিচালনার কাজগুলিকে অনেক সহজ করে তোলে৷

যদিও আপনি প্রসঙ্গ এবং টীকা ফাইল ব্যবহার করে আপনার সার্চ ইঞ্জিন তৈরি করার পরিকল্পনা করছেন, তবুও কন্ট্রোল প্যানেলের সাথে নিজেকে পরিচিত করা একটি ভাল ধারণা।

আপনি আপনার সার্চ ইঞ্জিনকে যত বেশি কাস্টমাইজ করবেন, এটি তত জটিল হবে। আপনাকে প্রোগ্রামেবল অনুসন্ধান উপাদান এবং বৈশিষ্ট্যগুলি শিখতে হবে, যেগুলি বাছাই করা কঠিন নয়, তবে সেগুলির জন্য আপনাকে কিছু সময় বিনিয়োগ করতে হবে৷

আপনাকে বাকি বিকাশকারী গাইড পড়তে হবে, যা দুর্ভাগ্যবশত সবচেয়ে উত্তেজনাপূর্ণ পড়ার উপাদান নয়।

প্রসঙ্গ: একটি সার্চ ইঞ্জিন স্পেসিফিকেশন এবং টীকা সংজ্ঞায়িত করা: সাইট নির্বাচন করা

উপরে ফিরে যান