יצירת Programmable Search Engine עם קובצי תצורה

בדף הזה אנחנו מסבירים על המושגים הבסיסיים של קובצי התצורה Programmable Search Engine.

  1. סקירה כללית
  2. מה כלול ב-Programmable Search Engine
  3. איך הרכיבים פועלים יחד
  4. יצירת מנוע חיפוש
  5. עריכת הקבצים של Programmable Search Engine
  6. בחירת הפורמט הנכון

סקירה כללית

אם לוח הבקרה לא מאפשר את רמת ההתאמה האישית הדרושה, מומלץ להשתמש בפורמט XML של Programmable Search, שמציע יותר שליטה, גמישות וגישה לתכונות חזקות יותר.

כדי להשתמש בקובצי התצורה של Programmable Search Engine, מתחילים ביצירת מנוע חיפוש בסיסי באמצעות לוח הבקרה של Programmable Search Engine. לאחר יצירת מנוע החיפוש, תוכלו להוריד את ההערות וקובצי ה-XML של ההקשר מהדף סקירה כללית בלוח הבקרה.

יסודות XML

שפת סימון ניתנת להרחבה או XML היא שפת סימון לשימוש כללי. זהו טקסט עם תגים שאפשר לקרוא. לדוגמה, פורמט ה-XML של Programmable Search כולל את התגים הבאים: <Context> </Context> ו-<LookAndFeel> </LookAndFeel>.

כמו בכל קובץ XML, המפרטים של Programmable Search Engine חייבים לעמוד בתחביר XML (<element attribute="value">content</element>) ובפורמט תקין. XML כולל את הכללים הבאים:

  • קוד XML מחייב הצהרת XML (<?xml version="1.0"?>) לפני התגים ברמה העליונה, אבל קובץ התצורה Programmable Search Engine לא מחייב זאת.
  • כל הרכיבים חייבים לכלול תג פתיחה (<tag>) ותג סוגר (</tag>).
  • כל התגים צריכים להיות מקוננים בצורה תקינה. לא ניתן להשתמש בקוד XML שנראה כך: <sandwich><filling> peanut butter</sandwich></filling>. במקום זאת, הוא אמור להיראות כך: <sandwich><filling> peanut butter</filling></sandwich>.
  • XML הוא תלוי אותיות רישיות (case-sensitive), לכן חשוב להקפיד על אותיות רישיות ואיות שגוי של התגים בהוראות.
  • כל ערכי המאפיינים חייבים להיות מוקפים במירכאות כפולות (<element attribute="value">).
  • יש להגדיר את כל המאפיינים בתג הפותח (<element attribute="value">), ולא בתג הסוגר ( </element>).

אפשר לכתוב הערות בעצמכם באמצעות תגי תגובה (<!-- your comment here -->), ו-Programmable Search Engine לא ינתח את שורת הטקסט הזו כקוד XML. מלבד כתיבת תזכורות או תיאורים, אפשר גם להשתמש בתגובות כדי לנצל באופן זמני קוד XML שלא עמלה העמלה (למשל, כי אתם רוצים להתנסות עם אפקטים מסוימים או כדי לפתור בעיות). עם זאת, ההערות האלה לא נשמרות בקבצים שאתם מורידים מלוח הבקרה. אם אתם רוצים לשמור את התגובות, עליכם לשמור עותק של קובצי ה-XML שהוספתם גם אחרי שמעלים אותם ללוח הבקרה.

אתם יכולים להשתמש בכלי פשוט לעריכת טקסט כדי ליצור ולערוך קובצי XML. פשוט שומרים את קובץ הטקסט עם סיומת הקובץ .xml (לדוגמה, cse_badminton.xml).

חזרה למעלה

מה כלול ב-Programmable Search Engine

Programmable Search Engine כולל שני רכיבים עיקריים, שכל אחד מהם נשלט באמצעות קובץ XML:

  • הקשר: קובץ ה-XML בהקשר מתאר את התכונות הבסיסיות של מנוע החיפוש. המדיניות הזו מציינת את ההגדרות הגלובליות של מנוע החיפוש, למשל אם מפעילים חיפוש באמצעות תמונות או קידומי מכירות. לכל מנוע חיפוש יש קובץ הקשר משלו. מידע נוסף על קובץ XML של ההקשר למידע נוסף על בחירת פורמט הקובץ המתאים ביותר למנוע החיפוש, ראו בחירת הפורמט הנכון למנוע החיפוש.
  • הערות: קובץ ה-XML של ההערות מפרט את דפי האינטרנט או האתרים שברצונך שמנוע החיפוש יכסה, ומציין את ההעדפות שלך לגבי אופן הדירוג של אתרים אלה בתוצאות החיפוש. כל אתר והמידע המשויך אליו נקראים הערה. מידע נוסף על קובץ ה-XML של ההערות

לא מומלץ ליצור קבצים חדשים מאפס. במקום זאת, אפשר להוריד אותם מהדף סקירה כללית בלוח הבקרה.

בנוסף לרכיבים העיקריים האלו, מנוע חיפוש יכול לכלול גם את קובצי העזר הבאים:

  • קידומי מכירות: קובץ ה-XML של קידומי המכירות מפרט סדרה של תוצאות מותאמות אישית שמופעלות על-ידי קבוצה מוגדרת מראש של מונחי שאילתות. כשמשתמש מקליד חיפוש שתואם בדיוק לאחד ממונחי השאילתה שלכם, קידום המכירות מופיע בראש הדף. אתם יכולים להשתמש בתכונה 'קידומי מכירות' כדי להשיב ישירות לשאילתות של המשתמשים, להוביל אותם למידע חשוב או להפנות אותם לדפי אינטרנט שלא מופיעים בראש דף התוצאות, אבל עדיין רלוונטיים במיוחד. בלוח הבקרה, קידומי המכירות מוגדרים בכרטיסייה קידומי מכירות. מידע נוסף על מבצעים
  • מילים נרדפות: קובץ ה-XML של המילים הנרדפות מרחיב את השאילתות של המשתמשים שלכם כך שיכלול גרסאות של מונח החיפוש. לדוגמה, אם המשתמש מחפש את המילה "סימולטור", מנוע החיפוש מחפש גם "קוף" ל-"ape". בלוח הבקרה, מילים נרדפות מוגדרות בכרטיסייה מילים נרדפות. מידע נוסף על מילים נרדפות.

איך הרכיבים פועלים יחד

קובץ ה-XML של ההקשר לא מציין את קובץ ההערות לשימוש, ו-XML של ההערות לא מפנה לקובץ ההקשר. Programmable Search Engine משתמש בתוויות כדי לשייך הקשר והערות. קובץ ה-XML של ההקשר כולל תוויות שמזהות את מנוע החיפוש, וכל הערה שמופיעה ב-XML של ההערות מתויגת בתווית אחת או יותר לזיהוי מנועי החיפוש שאליהם היא שייכת.אם משנים את שם התווית בקובץ ההקשר, צריך לשנות את כל ההערות שתויגו בתווית הזו.

למרות שניתן להעלות מספר קובצי הערות, כשמורידים אותם דרך לוח הבקרה, Programmable Search Engine ממזג את כל קובצי ההערות לקובץ הערות אחד. קובצי ההערות מאפשרים להתאים אישית את אותו האתר למנועי חיפוש שונים. לדוגמה, מנוע חיפוש אחד יכול להגביל את החיפוש שלו לאתרים מסוימים, מנוע חיפוש אחר יכול למחוק אתרים אלו ומנוע אחר יכול לקדם אתרים אלו.

context.xml

הנה דוגמה לקובץ contains.xml שמכיל תוויות המזהה את מנוע החיפוש שעליו הוא חל:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

הנה דוגמה לקובץ הערות שמראה איך כל אתר (הערה) משויך לתווית:

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

חזרה למעלה

יצירת מנועי חיפוש מתקדמים של Programmable Search

כדי ליצור מנועים מתקדמים, צריך לבצע את השלבים הבאים:

  1. קובעים את הפורמט שמתאים לצרכים שלכם.
  2. מגדירים את המפרט של מנוע החיפוש.
  3. איך להנחות את Programmable Search Engine באילו אתרים לחפש
  4. איך להנחות את Programmable Search Engine איך לדרג את תוצאות החיפוש

עריכת הקבצים של Programmable Search Engine

כדי לעבוד על קובץ XML, צריך להוריד את מפרט ה-XML מהדף סקירה כללית בלוח הבקרה. אין להתחיל קובץ מאפס. בצע את הפעולות הבאות:

  1. מורידים את קובץ ההקשר או את קובץ ההערות מהדף סקירה כללית בלוח הבקרה. לוחצים על הלחצן הורדה בקטע תכונות חיפוש.
  2. משתמשים בכלי לעריכת טקסט שמסוגל לטפל בסיומות שורות בסגנון UNIX (פועלות באמצעות WordPad, Emacs ו-TextMate, אבל NotePad לא פועל). לא משנה מה שם הקובץ, כל עוד שומרים אותו עם סיומת הקובץ .xml (לדוגמה, cx_global.xml)
  3. ליצור עותק גיבוי של הקובץ שהורדתם למקרה שהגרסה הערוכה שלכם לא תפעל כצפוי ותצטרכו לחזור לגרסה הקודמת.

    אם לא יצרתם עותק והגרסה שערכתם לא פועלת כהלכה, תצטרכו לנפות באגים בקובץ או ליצור מחדש את מנוע החיפוש. לא נהניתי.

  4. עורכים את קובץ ה-XML ושומרים אותו. מוודאים שעורך הטקסט שומר את הקובץ כמסמך טקסט ב-Unicode ולא בפורמט קובץ אחר.
  5. מעלים את הקובץ בקטע תכונות חיפוש בדף סקירה כללית.

בחירת הפורמט הנכון

לפני שתתחילו ליצור את Programmable Search Engine, תצטרכו לקבוע איזה פורמט הכי מתאים לצרכים שלכם. לא רוצים לבחור פורמט חזק ומורכב יותר ממה שנחוץ לכם, וגם לא להשתמש בפורמט שיגרום לכם להיעלם במהירות.

תוכלו להיעזר בטבלה הבאה כדי לבחור את הפורמט המתאים.

כדי ליצור שימוש כי מגבלות מידע נוסף
מנוע חיפוש אחד או כמה אתרים שיש בהם מעט אתרים לוח הבקרה כדי ליצור במהירות את Programmable Search Engine אפשר למלא תיבות טקסט במקום ליצור קבצים בכלי לעריכת טקסט ולהעלות את הקבצים. לוח הבקרה שימושי בעיקר כדי להכיר את Programmable Search Engine וליצור מנועי חיפוש עם מעט אתרים. איך מתחילים
מנועי חיפוש מורכבים שמשתמשים בהרבה אתרים, משתמשים בפידים קובץ הקשר וקובצי הערות

הקבצים של Programmable Search Engine מעניקים לכם יותר שליטה במנועי החיפוש, ומקלים מאוד על משימות ההגדרה והניהול של אתרים.

למרות שבכוונתך ליצור את מנוע החיפוש שלך באמצעות קובצי הקשר והערות, עדיין כדאי להכיר את לוח הבקרה.

ככל שמבצעים יותר התאמה אישית של מנוע החיפוש, כך הוא הופך למורכב יותר. עליכם ללמוד את הרכיבים והמאפיינים של Programmable Search, אמנם לא קשה לזהות אותם, אבל הם מחייבים אתכם להשקיע זמן.

תצטרכו לקרוא את שאר המדריך למפתחים, לצערי, זה לא חומר הקריאה הכי מרגש.

הקשר: הגדרת מפרטים של מנוע חיפוש והערות: בחירת אתרים

חזרה למעלה