การสร้าง Programmable Search Engine ด้วยไฟล์การกำหนดค่า

หน้านี้จะแนะนำแนวคิดพื้นฐานเกี่ยวกับไฟล์การกำหนดค่า Programmable Search Engine

  1. ภาพรวม
  2. สิ่งที่อยู่ใน Programmable Search Engine
  3. วิธีที่คอมโพเนนต์ทำงานร่วมกัน
  4. การสร้างเครื่องมือค้นหา
  5. การแก้ไขไฟล์ Programmable Search Engine
  6. การเลือกรูปแบบที่เหมาะสม

ภาพรวม

หากแผงควบคุมไม่สามารถปรับแต่งได้ตามที่คุณต้องการ ให้ลองใช้รูปแบบ XML ของ Programmable Search ซึ่งให้คุณควบคุม มีความยืดหยุ่น และเข้าถึงฟีเจอร์ที่มีประสิทธิภาพมากยิ่งขึ้นได้

หากต้องการใช้ไฟล์การกำหนดค่า Programmable Search Engine ให้เริ่มต้นด้วยการสร้างเครื่องมือค้นหาพื้นฐานโดยใช้แผงควบคุม Programmable Search Engine เมื่อสร้างเครื่องมือค้นหาแล้ว คุณสามารถดาวน์โหลดคำอธิบายประกอบและไฟล์ XML บริบทได้จากหน้าภาพรวมของแผงควบคุม

ข้อมูลพื้นฐานเกี่ยวกับ XML

Extensible Markup Language หรือ XML เป็นภาษามาร์กอัปที่มีวัตถุประสงค์ทั่วไป เป็นข้อความที่มีแท็กซึ่งสามารถอ่านได้ ตัวอย่างเช่น รูปแบบ Programmable Search XML จะมีแท็กต่อไปนี้ <Context> </Context> และ <LookAndFeel> </LookAndFeel>

เช่นเดียวกับไฟล์ XML อื่นๆ ข้อกำหนดของ Programmable Search Engine ต้องเป็นไปตามไวยากรณ์ XML (<element attribute="value">content</element>) และอยู่ในรูปแบบที่ถูกต้อง XML มีกฎต่อไปนี้

  • XML กำหนดว่าคุณต้องใส่การประกาศ XML (<?xml version="1.0"?>) ไว้หน้าแท็กระดับบนสุด แต่ไฟล์การกำหนดค่า Programmable Search Engine ไม่จำเป็นต้องใช้
  • องค์ประกอบทั้งหมดต้องมีแท็กเปิด (<tag>) และแท็กปิด (</tag>)
  • แท็กทั้งหมดของคุณต้องซ้อนกันอย่างเหมาะสม คุณไม่สามารถมีโค้ด XML ที่มีลักษณะเช่นนี้: <sandwich><filling> peanut butter</sandwich></filling> แต่ควรมีลักษณะดังนี้ <sandwich><filling> peanut butter</filling></sandwich>
  • XML จะคำนึงถึงตัวพิมพ์เล็กและตัวพิมพ์ใหญ่ ดังนั้นโปรดใช้อักษรตัวพิมพ์ใหญ่และการสะกดของแท็กในคำแนะนำอย่างระมัดระวัง
  • ค่าแอตทริบิวต์ทั้งหมดต้องใส่เครื่องหมายคำพูดคู่ (<element attribute="value">)
  • แอตทริบิวต์ทั้งหมดต้องกำหนดไว้ในแท็กเปิด (<element attribute="value">) ไม่ใช่แท็กปิด ( </element>)

คุณสามารถเขียนบันทึกสำหรับตัวเองโดยใช้แท็กความคิดเห็น (<!-- your comment here -->) และ Programmable Search Engine จะไม่แยกวิเคราะห์บรรทัดข้อความนั้นเป็นโค้ด XML นอกเหนือจากการเขียนการช่วยเตือนหรือคำอธิบายแล้ว คุณยังใช้ความคิดเห็นเพื่อวางโค้ด XML บางรายการไม่ให้ได้รับค่าคอมมิชชันชั่วคราว (อาจเป็นเพราะคุณต้องการทดสอบเอฟเฟกต์บางอย่างหรือต้องการแก้ปัญหา) อย่างไรก็ตาม ความคิดเห็นเหล่านี้จะไม่ปรากฏในไฟล์ที่คุณดาวน์โหลดจากแผงควบคุม หากคุณต้องการเก็บความคิดเห็นไว้ คุณควรเก็บสำเนาของไฟล์ XML ที่แสดงความคิดเห็นไว้ แม้คุณจะอัปโหลดไฟล์ลงในแผงควบคุมแล้วก็ตาม

คุณใช้เครื่องมือแก้ไขข้อความแบบง่ายเพื่อสร้างและแก้ไขไฟล์ XML ได้ เพียงบันทึกไฟล์ข้อความที่มีนามสกุลไฟล์ .xml (เช่น cse_badminton.xml)

กลับไปด้านบน

สิ่งที่อยู่ใน Programmable Search Engine

Programmable Search Engine มีคอมโพเนนต์หลัก 2 ส่วน ซึ่งแต่ละคอมโพเนนต์ควบคุมโดยไฟล์ XML ดังนี้

  • บริบท: ไฟล์ XML บริบทอธิบายคุณลักษณะพื้นฐานของเครื่องมือค้นหา โดยจะระบุการตั้งค่าโดยรวมของเครื่องมือค้นหา เช่น มีการเปิดใช้งานการค้นหารูปภาพหรือโปรโมชัน เครื่องมือค้นหาแต่ละรายการจะมีไฟล์บริบทของตัวเอง ข้อมูลเพิ่มเติมเกี่ยวกับไฟล์ XML บริบท สำหรับข้อมูลเพิ่มเติมเกี่ยวกับการเลือกรูปแบบไฟล์ที่เหมาะสมที่สุดสำหรับเครื่องมือค้นหาของคุณ โปรดดูการเลือกรูปแบบที่ถูกต้องสำหรับเครื่องมือค้นหา
  • หมายเหตุ: ไฟล์ XML คำอธิบายประกอบจะแสดงรายการหน้าเว็บหรือเว็บไซต์ที่คุณต้องการให้เครื่องมือค้นหาครอบคลุม และระบุค่ากำหนดที่คุณมีเกี่ยวกับวิธีการจัดอันดับเว็บไซต์เหล่านี้ในผลการค้นหา แต่ละเว็บไซต์และข้อมูลที่เกี่ยวข้องจะเรียกว่าหมายเหตุ ข้อมูลเพิ่มเติมเกี่ยวกับไฟล์ XML คำอธิบายประกอบ

เราไม่แนะนำให้สร้างไฟล์เหล่านี้ตั้งแต่เริ่มต้น แต่ให้ดาวน์โหลดจากหน้าภาพรวมของแผงควบคุมแทน

นอกจากองค์ประกอบหลักเหล่านี้แล้ว เครื่องมือค้นหายังมีไฟล์เสริมต่อไปนี้ด้วย

  • โปรโมชัน: ไฟล์ XML โปรโมชันจะแสดงชุดผลลัพธ์ที่กำหนดเองซึ่งทริกเกอร์โดยชุดข้อความค้นหาที่กำหนดไว้ล่วงหน้า เมื่อผู้ใช้พิมพ์การค้นหาที่ตรงกับคำค้นหาคำใดคำหนึ่งของคุณ โปรโมชันจะปรากฏที่ด้านบนของหน้า คุณสามารถใช้โปรโมชันเพื่อตอบคำถามของผู้ใช้โดยตรง นำผู้ใช้ไปยังข้อมูลสำคัญ หรือแนะนำหน้าเว็บที่ไม่ได้อยู่ด้านบนของหน้าผลการค้นหาซึ่งมีความเกี่ยวข้องเป็นพิเศษ โปรโมชันจะกำหนดไว้ในแท็บโปรโมชันในแผงควบคุม ข้อมูลเพิ่มเติมเกี่ยวกับโปรโมชัน
  • คำพ้องความหมาย: ไฟล์ XML ของคำพ้องความหมายจะขยายการค้นหาของผู้ใช้เพื่อรวมรูปแบบต่างๆ ของข้อความค้นหา ตัวอย่างเช่น หากผู้ใช้ของคุณค้นหาคำว่า "simian" เครื่องมือค้นหาก็ค้นหาคำว่า "ลิง" ด้วย และ "ลิง" ในแผงข้อมูล คำพ้องความหมายจะกำหนดไว้ในแท็บ คำพ้องความหมาย ข้อมูลเพิ่มเติมเกี่ยวกับคำพ้องความหมาย

คอมโพเนนต์ต่างๆ ทำงานร่วมกันอย่างไร

ไฟล์ XML บริบทไม่ได้ระบุไฟล์คำอธิบายประกอบที่จะใช้ และ XML คำอธิบายประกอบไม่ได้อ้างอิงถึงไฟล์บริบท Programmable Search Engine จะใช้ป้ายกำกับในการเชื่อมโยงบริบทและคำอธิบายประกอบ ไฟล์ XML บริบทประกอบด้วยป้ายกำกับที่ระบุเครื่องมือค้นหา และคำอธิบายประกอบแต่ละรายการที่อยู่ใน XML ของคำอธิบายประกอบจะมีการติดแท็กด้วยป้ายกำกับอย่างน้อยหนึ่งป้ายที่ระบุเครื่องมือค้นหาที่เป็นเจ้าของป้ายกำกับดังกล่าว หากคุณเปลี่ยนชื่อป้ายกำกับในไฟล์บริบท คุณจะต้องเปลี่ยนแปลงคำอธิบายประกอบทั้งหมดที่ถูกติดแท็กด้วยป้ายกำกับนั้น

แม้ว่าคุณจะสามารถอัปโหลดไฟล์คำอธิบายประกอบได้หลายไฟล์ แต่เมื่อคุณดาวน์โหลดไฟล์ดังกล่าวผ่านแผงควบคุม Programmable Search Engine จะรวมไฟล์คำอธิบายประกอบทั้งหมดของคุณไว้ในไฟล์คำอธิบายประกอบไฟล์เดียว ไฟล์คำอธิบายประกอบให้ความยืดหยุ่นในการกำหนดค่าเว็บไซต์เดียวกันสำหรับเครื่องมือค้นหาต่างๆ ตัวอย่างเช่น เครื่องมือค้นหาหนึ่งอาจจำกัดการค้นหาไว้เฉพาะบางเว็บไซต์ อีกเครื่องมือค้นหาหนึ่งอาจกำจัดเว็บไซต์เหล่านั้น ส่วนอีกเครื่องมือค้นหาหนึ่งอาจโปรโมตเว็บไซต์เหล่านั้น

context.xml

ต่อไปนี้คือตัวอย่างไฟล์ Context.xml ที่มีป้ายกำกับที่ระบุเครื่องมือค้นหาที่เกี่ยวข้อง

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

ต่อไปนี้เป็นตัวอย่างของไฟล์คำอธิบายประกอบที่แสดงให้เห็นว่าแต่ละเว็บไซต์ (คำอธิบายประกอบ) เชื่อมโยงกับป้ายข้อความอย่างไร:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

กลับไปด้านบน

การสร้าง Programmable Search Engine ขั้นสูง

การสร้างเครื่องมือขั้นสูงมีขั้นตอนดังนี้

  1. ระบุรูปแบบที่เหมาะกับความต้องการของคุณ
  2. กำหนดข้อกำหนดสำหรับเครื่องมือค้นหา
  3. บอก Programmable Search Engine ว่าจะค้นหาเว็บไซต์ใด
  4. บอก Programmable Search Engine เกี่ยวกับวิธีจัดอันดับผลการค้นหา

การแก้ไขไฟล์ Programmable Search Engine

หากต้องการทำงานกับไฟล์ XML ให้ดาวน์โหลดข้อกำหนด XML จากหน้าภาพรวมของแผงควบคุม อย่าเริ่มต้นไฟล์ใหม่ตั้งแต่ต้น ทำสิ่งต่อไปนี้:

  1. ดาวน์โหลดไฟล์บริบทหรือไฟล์คำอธิบายประกอบจากหน้าภาพรวมของแผงควบคุม คลิกปุ่มดาวน์โหลดในส่วนฟีเจอร์การค้นหา
  2. ใช้โปรแกรมแก้ไขข้อความที่รองรับนามสกุลบรรทัดแบบ UNIX ได้ (WordPad, Emacs และ TextMate ทำงาน แต่ NotePad ใช้ไม่ได้) ไม่ว่าจะตั้งชื่อไฟล์ว่าอะไร ตราบใดที่คุณบันทึกไฟล์ด้วยนามสกุลไฟล์ .xml (เช่น cx_global.xml)
  3. ทำสำเนาข้อมูลสำรองของไฟล์ที่ดาวน์โหลดไว้ในกรณีที่เวอร์ชันที่แก้ไขไม่ทำงานตามที่คาดไว้ และคุณต้องเปลี่ยนกลับไปใช้เวอร์ชันก่อนหน้า

    หากไม่ทำสำเนาและเวอร์ชันที่คุณแก้ไขทำงานไม่ถูกต้อง คุณจะต้องแก้ไขข้อบกพร่องของไฟล์หรือสร้างเครื่องมือค้นหาใหม่อีกครั้ง ไม่สนุก

  4. แก้ไขไฟล์ XML แล้วบันทึก ตรวจสอบว่าเครื่องมือแก้ไขข้อความบันทึกไฟล์เป็นเอกสารข้อความ Unicode ไม่ใช่รูปแบบไฟล์อื่น
  5. อัปโหลดไฟล์ในส่วนฟีเจอร์การค้นหาในหน้าภาพรวม

การเลือกรูปแบบที่เหมาะสม

ก่อนเริ่มสร้าง Programmable Search Engine โปรดเลือกรูปแบบที่เหมาะกับความต้องการของคุณมากที่สุด คุณไม่ควรเลือกรูปแบบที่มีประสิทธิภาพและซับซ้อนมากกว่าที่ต้องการ หรือไม่ต้องการใช้รูปแบบนั้นจะเติบโตอย่างรวดเร็ว

ใช้ตารางต่อไปนี้เพื่อเลือกรูปแบบที่เหมาะสม

วิธีสร้าง ใช้ เพราะ ข้อจำกัด ข้อมูลเพิ่มเติม
เครื่องมือค้นหา 1 หรือ 2-3 รายการที่มีเว็บไซต์จำนวนไม่มาก แผงควบคุม คุณสร้าง Programmable Search Engine ได้อย่างรวดเร็วโดยกรอกกล่องข้อความแทนการสร้างไฟล์ด้วยเครื่องมือแก้ไขข้อความและอัปโหลดไฟล์ แผงควบคุมมีประโยชน์อย่างมากในการทำความคุ้นเคยกับ Programmable Search Engine และการสร้างเครื่องมือค้นหาด้วยเว็บไซต์เพียงไม่กี่แห่ง การเริ่มต้นใช้งาน
เครื่องมือค้นหาที่ซับซ้อนที่ใช้เว็บไซต์จำนวนมากใช้ฟีด ไฟล์บริบทและคำอธิบายประกอบ

ไฟล์ Programmable Search Engine ช่วยให้คุณควบคุมเครื่องมือค้นหาได้ในระดับที่สูงขึ้น ทำให้งานในการกำหนดและจัดการเว็บไซต์ง่ายขึ้นมาก

แม้ว่าคุณจะวางแผนที่จะสร้างเครื่องมือค้นหาโดยใช้ไฟล์บริบทและคำอธิบายประกอบ แต่คุณควรทำความคุ้นเคยกับแผงควบคุม

ยิ่งคุณปรับแต่งเครื่องมือค้นหามากเท่าใด เครื่องมือค้นหาก็จะยิ่งซับซ้อนมากขึ้นเท่านั้น คุณต้องศึกษาองค์ประกอบและแอตทริบิวต์ของ Programmable Search ที่เข้าใจได้ไม่ยาก แต่ก็ต้องใช้เวลาพอสมควร

คุณจะต้องอ่านคู่มือนักพัฒนาซอฟต์แวร์ส่วนที่เหลือ ซึ่งไม่ใช่เนื้อหาการอ่านที่น่าตื่นเต้นที่สุด

บริบท: การกำหนดข้อกำหนดของเครื่องมือค้นหา และ หมายเหตุ: การเลือกเว็บไซต์

กลับไปด้านบน