לארגונים יש לעיתים קרובות טרמינולוגיה ייחודית או כמה דרכים להתייחס לאותו מושג. הגדרת מילים נרדפות מאפשרת להגדיר שוויון בין מונחים, וכך לעזור למשתמשים למצוא פריטים במהלך חיפושים.
כדי להגדיר מילים נרדפות, צריך ליצור אינדקס לפריטים באמצעות סכימת _dictionaryEntry well-known.
פריטים מהסוג _dictionaryEntry יכולים לכלול את המאפיינים הבאים:
| נכס | סוג | תיאור | חובה? |
|---|---|---|---|
_term |
string | המונח להגדרה. הערכים המומלצים הם מילים או ביטויים ללא מקפים או סימני פיסוק. | חובה |
_synonym |
string (repeated) | מונחים חלופיים שייכללו בשאילתות שתואמות למחרוזת שהוגדרה ב_term. |
חובה |
_onlyApplicableForAttachedSearchApplications |
boolean | מאפשר לקבץ מילים נרדפות לפי מקור נתונים ואפליקציית חיפוש. מידע נוסף זמין במאמר בנושא הגדרת מילים נרדפות ספציפיות למקור נתונים. | אופציונלי |
כשמשתמש כולל ערך _term בשאילתה, השאילתה האפקטיבית הופכת ל-term OR synonyms. לדוגמה, אם מגדירים את "scifi" עם המילה הנרדפת "science
fiction", שאילתה של "scifi" תתאים לפריטים שמכילים את אחד מהמונחים האלה.
כברירת מחדל, מילים נרדפות לא פועלות בשני הכיוונים. שאילתה של "science fiction" תתאים רק לביטוי המדויק הזה, אלא אם תגדירו אותה גם כמונח עם "scifi" כמילה נרדפת. כדי שיהיה אפשר להשתמש במונחים לסירוגין, צריך להגדיר כל אחד מהם בנפרד:
| מונח | מילים נרדפות |
|---|---|
| scifi | science fiction |
| science fiction | scifi |
במהלך עיבוד השאילתה, המערכת מסירה את סימני הפיסוק והמקפים לפני שהיא מחילה מילים נרדפות.
שאילתה לחיפוש "sci-fi" תואמת למונח "sci fi". כדי לתמוך במונחים עם מקפים, צריך לבצע נורמליזציה של _term כך שייעשה שימוש ברווחים במקום במקפים.
דוגמאות לשימוש חלופי:
| מונח | מילים נרדפות |
|---|---|
| scifi | science fiction, sci fi |
| sci fi | science fiction, scifi |
| science fiction | scifi, sci fi |
כברירת מחדל, מילים נרדפות חלות על כל הדומיין ועל כל אפליקציות החיפוש. כדי להגביל אותם, אפשר לעיין במאמר בנושא הגדרת מילים נרדפות ספציפיות למקור נתונים.
הגדרת מילים נרדפות גלובליות באמצעות ה-SDK
אפשר להשתמש ב-SDK של מחבר התוכן כדי להגדיר מונחים ומילים נרדפות. פרטים נוספים זמינים במאמר בנושא יצירת מחבר תוכן.
קטע הקוד הזה יוצר RepositoryDoc מרשומה ב-CSV:
שיקולים חשובים:
- הערכים של מילים נרדפות צריכים להיות ציבוריים בדומיין. לדוגמה, אפשר להגדיר את רשימת ה-ACL ל-
DOMAIN_PUBLIC_ACL. - אל תשתמשו בהגדרות בקובץ התצורה שמבטלות את ההגדרה הזו, כמו
defaultAcl.mode=FALLBACKאוdefaultAcl.public=true.
הגדרת מילים נרדפות ספציפיות לאפליקציית החיפוש
כדי לספק מילים נרדפות ספציפיות לצוות (למשל, לצוות ההנדסה לעומת צוות המכירות), צריך להוסיף לכל מילה נרדפת אינדקס עם _onlyApplicableForAttachedSearchApplications=true. הפעולה הזו מגבילה את המילים הנרדפות לאפליקציות חיפוש שכוללות את מקור הנתונים הספציפי.
דוגמה:
structuredData.put("_onlyApplicableForAttachedSearchApplications", true);