הפניה לממשק API של XML

הדף הזה מתייחס לגרסת ה-XML של Custom Search JSON API, שזמינה רק לקוחות של Google Site Search.

  1. סקירה כללית
  2. פורמט הבקשה של Programmable Search Engine
    1. בקשת סקירה כללית
    2. תנאי השאילתה
    3. הפרמטרים של הבקשה
      1. שאילתות לדוגמה של WebSearch
      2. הגדרות פרמטרים של שאילתת WebSearch
      3. חיפוש מתקדם
      4. פרמטרים מתקדמים של שאילתות חיפוש
      5. תנאים מיוחדים לשאילתה
      6. שאילתות עם תמונה לדוגמה
      7. פרמטרים של שאילתות חיפוש באמצעות תמונות
      8. הגבלות על בקשות
    4. מצגת בינלאומית של שאילתות ותוצאות
      1. קידוד תווים
      2. שפות ממשק
      3. חיפוש בסינית פשוטה ומסורתית
    5. סינון התוצאות
      1. סינון אוטומטי של תוצאות החיפוש
      2. סינון לפי שפות ומדינות
      3. סינון תוכן למבוגרים בלבד באמצעות החיפוש הבטוח
  3. תוצאות XML
    1. תוצאות DTD של Google XML
    2. מידע על תגובת ה-XML
    3. תוצאות XML עבור רגיל, תמונה ו שאילתות חיפוש מתקדם
      1. חיפוש רגיל/מתקדם: שאילתה לדוגמה ותוצאת XML
      2. חיפוש רגיל/מתקדם: תגי XML
      3. תוצאות XML לשאילתות של חיפוש תמונות
      4. חיפוש תמונות: שאילתה לדוגמה ותוצאת XML
      5. חיפוש תמונות: תגי XML

סקירה כללית

שירות Google WebSearch מפעיל את 'חיפוש באתר' של Google ללקוחות להציג תוצאות חיפוש של Google באתרים שלהם. שירות WebSearch משתמש בפרוטוקול פשוט מבוסס HTTP להצגת חיפוש תוצאות. למנהלי החיפוש יש שליטה מלאה על האופן שבו הם לבקש תוצאות חיפוש ואת הדרך שבה הן מציגות את התוצאות האלה למשתמש קצה. במסמך הזה מתוארים הפרטים הטכניים של פלטפורמת Google של בקשות חיפוש ותוצאות.

כדי לאחזר תוצאות של Google WebSearch, האפליקציה שלך שולחת ב-Google, בקשת HTTP פשוטה. לאחר מכן Google מחזירה תוצאות חיפוש ב-XML הפורמט. תוצאות בפורמט XML מאפשרות לבצע התאמה אישית באופן שבו תוצאות החיפוש מוצגות.

פורמט הבקשה של WebSearch

סקירה כללית של הבקשה

הבקשה של חיפוש Google היא פקודת GET רגילה של HTTP. הוא הדוח כולל אוסף של פרמטרים שרלוונטיים שאילתות. הפרמטרים האלה נכללים בכתובת ה-URL של הבקשה בתור name=value זוגות שמופרדים באמצעות תווי אמפרסנד (&). הפרמטרים כוללים נתונים כמו שאילתת החיפוש ומזהה מנוע חיפוש ייחודי (cx) שמזהה את שמבצע את בקשת ה-HTTP. השירות WebSearch או Image Search מחזיר XML התוצאה היא בקשות ה-HTTP שלכם.

מונחי השאילתה

רוב בקשות החיפוש כוללות מונח שאילתה אחד או יותר. מונח שאילתה מופיע כערך של פרמטר בבקשת החיפוש.

מונחי השאילתה יכולים לציין מספר סוגי מידע לסינון לארגן את תוצאות החיפוש ש-Google תחזיר. השאילתות יכולות לציין:

  • מילים או ביטויים להכללה או לא לכלול
    • כל המילים בשאילתת החיפוש (ברירת מחדל)
    • ביטוי מדויק בשאילתת החיפוש
    • כל מילה או ביטוי בשאילתת חיפוש
  • איפה במסמך מחפשים את מונחי חיפוש
    • במקום כלשהו במסמך (ברירת מחדל)
    • רק בגוף המסמך
    • רק בכותרת המסמך
    • רק בכתובת ה-URL של המסמך
    • רק בקישורים במסמך
  • הגבלות על המסמכים עצמם
    • הכללה או החרגה של מסמכים מסוגי קבצים מסוימים (כמו קובצי PDF או מסמכי Word)
  • שאילתות מיוחדות על כתובות URL שמחזירות מידע על כתובת URL מסוימת, במקום לבצע חיפוש
    • שאילתות שמחזירות מידע כללי על כתובת URL, כמו הקטגוריה, קטע הטקסט או השפה של הספרייה הפתוחה
    • שאילתות המחזירות קבוצה של דפי אינטרנט המקשרים לכתובת URL
    • שאילתות שמחזירות קבוצה של דפי אינטרנט שדומים לכתובת URL נתונה

חיפוש ברירת המחדל

ערכי הפרמטרים של שאילתות החיפוש צריכים להיות מסומנים בתווי בריחה (escape) בכתובת URL. שימו לב: יחליף את סימן הפלוס ("+") בכל רצף של רווח לבן שאילתת החיפוש. הנושא הזה מוסבר בפירוט בקטע הסרת כתובת URL מ-URL במסמך הזה.

מונח שאילתת החיפוש נשלח לשירות WebSearch באמצעות הפרמטר q. א' מונח שאילתת החיפוש לדוגמה הוא:

q=horses+cows+pigs

כברירת מחדל, שירות Google WebSearch מחזיר רק מסמכים לכלול את כל המונחים בשאילתת החיפוש.

הפרמטרים של הבקשה

בקטע הזה מפורטים הפרמטרים שבהם אפשר להשתמש כדי ליצור לבקשת החיפוש. הפרמטרים מחולקים לשתי רשימות. הרשימה הראשונה כוללת פרמטרים שרלוונטיים לכל בקשות החיפוש. הרשימה השנייה מכילה פרמטרים הן רלוונטיות רק לבקשות חיפוש מתקדם.

נדרשים שלושה פרמטרים של הבקשה:

  • יש להגדיר את הפרמטר client כ-google-csbe
  • הפרמטר output מציין את פורמט של תוצאות ה-XML המוחזרות; ניתן להחזיר תוצאות עם (xml) או ללא (xml_no_dtd) הפניה למספר DTD של Google. ההמלצות שלנו הגדרת הערך הזה ל-xml_no_dtd. הערה: אם לא מציינים את הפרמטר הזה, התוצאות יוחזרו HTML במקום XML.
  • הפרמטר cx שמייצג את הערך מזהה המנוע.

הפרמטרים הנפוצים ביותר של בקשות, מלבד הפרמטרים שהוזכרו למעלה הן:

  • num – המספר המבוקש של תוצאות החיפוש
  • q – מונחי החיפוש
  • start – האינדקס ההתחלתי של התוצאות

שאילתות לדוגמה ב-WebSearch

הדוגמאות הבאות מראות שתי בקשות HTTP של WebSearch כדי תמחיש איך משתמשים בפרמטרים שונים של שאילתה. הגדרות של פרמטרים שונים של שאילתות מספקים בשאילתת WebSearch הגדרות פרמטרים ושאילתת חיפוש מתקדמת פרמטרים של המסמך הזה.

בבקשה הזו מבקשת את 10 התוצאות הראשונות (start=0&num=10) עבור מונח השאילתה 'רד סוקס' (q=red+sox). השאילתה גם מציין שהתוצאות צריכות להגיע מאתרי אינטרנט קנדיים (cr=countryCA) וצריך לכתוב אותן בצרפתית (lr=lang_fr). לבסוף, מציין ערכים עבור הלקוח, פלט, ו-cx, וכל שלושת הפרמטרים האלה נדרשים.

http://www.google.com/search?
start=0
&num=10
&q=red+sox
&cr=countryCA
&lr=lang_fr
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

בדוגמה הזו נשתמש בחלק משאילתת החיפוש המתקדם כדי להתאים אישית עוד יותר את שאילתת החיפוש. הבקשה הזו משתמשת בפונקציה as_q הפרמטר (as_q=red+sox) במקום הפרמטר q. הוא גם משתמש as_eq כדי להחריג מסמכים שמכילים את המילה 'Yankees' מ- תוצאות החיפוש (as_eq=yankees).

http://www.google.com/search?
start=0
&num=10
&as_q=red+sox
&as_eq=Yankees
&client=google-csbe
&output=xml_no_dtd
&cx=00255077836266642015:u-scht7a-8i

הגדרות פרמטרים של שאילתת WebSearch

c2coff
תיאור

אופציונלי. הפרמטר c2coff מפעיל או משבית את התכונה פשוטה וחיפוש בסינית מסורתית.

ערך ברירת המחדל של הפרמטר הזה הוא 0 (אפס). כלומר, שהתכונה מופעלת. הערכים של הפרמטר c2coff הם:

ערך פעולה
1 מושבת
0 מופעל
דוגמאות q=google&c2coff=1

לקוח
תיאור

נדרש. יש להגדיר את הפרמטר client כ-google-csbe.

דוגמאות q=google&client=google-csbe

cr
תיאור

אופציונלי. הפרמטר cr מגביל את תוצאות החיפוש למסמכים שמקורם מדינה מסוימת. אפשר להשתמש בערך בוליאני אופרטורים ב-cr עם ערך מסוים.

Google WebSearch קובע את המדינה של מסמך לפי בתהליך ניתוח:

  • הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
  • המיקום הגיאוגרפי של כתובת ה-IP של שרת האינטרנט

ראו את הפרמטר 'מדינה (cr)' ערכים עבור רשימה של הערכים החוקיים לפרמטר הזה.

דוגמאות q=Frodo&cr=countryNZ

CX
תיאור

נדרש. הפרמטר cx מציין קוד שמזהה דוגמה מנוע חיפוש. כדי לאחזר תוצאות חיפוש מהמנוע הזה, צריך לציין Programmable Search Engine באמצעות הפרמטר cx.

כדי למצוא את הערך של הפרמטר cx, צריך לעבור אל 'לוח הבקרה' > קודים בכרטיסיית המנוע של המנוע ותוכלו למצוא אותה באזור הטקסט בקטע 'הדבקה של הקוד הזה בדף שבו ברצונך שתיבת החיפוש' יופיעו. תוצאות החיפוש יוצגו בדף באירוח Google.'

דוגמאות q=Frodo&cx=00255077836266642015:u-scht7a-8i

סינון
תיאור

אופציונלי. הפרמטר filter מפעיל או משבית את הסינון האוטומטי של תוצאות החיפוש ב-Google. קראו את הקטע סינון אוטומטי במאמר הזה. המסמך הזה כדי לקבל מידע נוסף על מסנני תוצאות החיפוש של Google.

ערך ברירת המחדל של הפרמטר filter הוא 1, שמציין שהתכונה מופעלת. ערכים תקינים בשדה הזה הם:

ערך פעולה
1 מושבת
0 מופעל

הערה: כברירת מחדל, Google מחילה את הסינון על כל המשתמשים כדי לשפר את האיכות של התוצאות האלה.

דוגמאות q=google&filter=0

gl
תיאור

אופציונלי. ערך הפרמטר gl הוא קוד מדינה בן שתי אותיות. בתוצאות של WebSearch, הפרמטר gl משפר את תוצאות החיפוש שמדינת המקור שלהן תואמת כערך הפרמטר. בקטע קודי מדינות תוכלו למצוא רשימה של ערכים חוקיים.

ציון ערך פרמטר של gl בבקשות WebSearch אמור לשפר את הרלוונטיות של התוצאות. זה במיוחד נכון ללקוחות בינלאומיים, ובמיוחד ללקוחות לקוחות שנמצאים במדינות דוברות אנגלית מחוץ לארה"ב.

דוגמאות

הבקשה הזו מקדמת מסמכים שנכתבו בבריטניה תוצאות חיפוש ב-WebSearch:
q=pizza&gl=uk


hl
תיאור

אופציונלי. הפרמטר hl מציין את הערך שפת הממשק (שפת המארח) של ממשק המשתמש. כדי לשפר את הביצועים והאיכות של תוצאות החיפוש, מומלץ להגדיר את הפרמטר הזה באופן מפורש.

ראה את הקטע שפות ממשק של שאילתות בינלאומיות ומצגות תוצאות למידע נוסף ולשפות ממשק נתמכות לרשימת השפות הנתמכות.

דוגמאות

הבקשה הזו מטרגטת מודעות שמקדמות יין בצרפתית. (מספר זיהוי הרכב הוא את המונח בצרפתית ליין.)

q=vin&ip=10.10.10.10&ad=w5&hl=fr

מטרופולין
תיאור

אופציונלי. הפרמטר hq מצרף את מונחי השאילתה שצוינו אל את השאילתה, כאילו הם שולבו עם אופרטור AND לוגי.

דוגמאות

הבקשה הזו מחפשת 'פיצה' וגם 'גבינה'. הביטוי זהה ל-q=pizza+cheese.

q=pizza&hq=cheese


ie
תיאור

אופציונלי. הפרמטר ie מגדיר את התו של סכימת הקידוד שבה צריך להשתמש כדי לפרש את מחרוזת השאילתה. ערך ברירת המחדל של ie הוא latin1.

בקטע קידוד תווים מוסבר מתי כדאי להשתמש בפרמטר.

לפרטים נוספים, אפשר לעיין בקטע קידוד תווים סעיף סכימות לרשימת ערכי ie האפשריים.

דוגמאות q=google&ie=utf8&oe=utf8
lr
תיאור

אופציונלי. הפרמטר lr (הגבלת שפה) מגביל את תוצאות החיפוש למסמכים שנכתבו בשפה מסוימת.

מערכת Google WebSearch קובעת את השפה של מסמך לפי בתהליך ניתוח:

  • הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
  • מטא תגים של שפה בתוך המסמך
  • השפה הראשית שבה כתוב הטקסט במסמך
  • שפות משניות, אם יש, שמופיעות בגוף הטקסט של המסמך

להצגת השפה (lr) הקטע 'ערכי אוסף' עם רשימה של ערכים תקינים הפרמטר.

דוגמאות q=Frodo&lr=lang_en

מספר
תיאור

אופציונלי. הפרמטר num מזהה את מספר תוצאות החיפוש שיש להחזיר.

ערך ברירת המחדל של num הוא 10, והערך המקסימלי הוא 20. אם מבקשים יותר מ-20 תוצאות, רק 20 התוצאות יוחזרו.

הערה: אם המספר הכולל של תוצאות החיפוש נמוך יותר ממספר התוצאות המבוקש, כל תוצאות החיפוש הזמינות שיוחזר.

דוגמאות q=google&num=10

או
תיאור

אופציונלי. הפרמטר oe מגדיר את התו של סכימת הקידוד שבה צריך להשתמש כדי לפענח את תוצאת ה-XML. ערך ברירת המחדל של oe הוא latin1.

בקטע קידוד תווים מוסבר מתי כדאי להשתמש בפרמטר.

לפרטים נוספים, אפשר לעיין בקטע קידוד תווים סעיף סכימות לרשימת ערכי oe האפשריים.

דוגמאות q=google&ie=utf8&oe=utf8

output
תיאור

נדרש. הפרמטר output מציין את הפורמט של תוצאות ה-XML. הערכים התקפים היחידים של הפרמטר הזה הם xml ו-xml_no_dtd. בטבלה הבאה נסביר את ההבדלים בין ערכי הפרמטרים.

ערך תצורת עיצוב
xml_no_dtd תוצאות ה-XML לא יכללו רכיב הצהרת DOCTYPE. (מומלץ)
xml תוצאות ה-XML יכילו את התג Google מסמך עזר של DTD. השורה השנייה של התוצאה תזהה את המסמך סוג ההגדרה (DTD) שהתוצאות משתמשות בו:
    <!DOCTYPE GSP SYSTEM "google.dtd">
דוגמאות output=xml_no_dtd
output=xml

q
תיאור

אופציונלי. הפרמטר q מציין את אפשרות החיפוש השאילתה שהוזנה על ידי המשתמש. למרות שהפרמטר הזה הוא אופציונלי, חייב לציין ערך עבור לפחות אחד מהפרמטרים של השאילתה (as_epq, as_lq, as_oq, as_q כדי לקבל תוצאות חיפוש.

יש גם כמה מונחי שאילתה מיוחדים שיכולים משמש כחלק מהפרמטר q עם ערך מסוים. רשימה והגדרות של המונחים האלה אפשר למצוא בקטע תנאים של שאילתות מיוחדות.

לוח הבקרה של חיפוש Google כולל דוח לגבי שאילתות שנשלחו באמצעות הפרמטר q.

הערה: הערך שצוין לפרמטר q חייב להיות מסומנים בתו בריחה (escape) בכתובת URL.

דוגמאות q=vacation&as_oq=london+paris

בטיחות
תיאור

אופציונלי. הפרמטר safe מציין איך יש לסנן תוצאות חיפוש לפי תוכן למבוגרים בלבד תוכן פורנוגרפי. ערך ברירת המחדל של הפרמטר safe הוא off. ערכי פרמטרים חוקיים הן:

ערך פעולה
off השבתת החיפוש הבטוח
medium הפעלת החיפוש הבטוח
high הפעלת גרסה מחמירה יותר של חיפוש בטוח

ראו סינון תוכן למבוגרים בלבד עם חיפוש בטוח לקבלת פרטים נוספים על התכונה הזו.

דוגמאות q=adult&safe=high

התחלה
תיאור

אופציונלי. הפרמטר start מציין את התוצאה התואמת הראשונה שצריך לכלול בתוצאות החיפוש. הפרמטר start משתמש באינדקס מבוסס אפס. כלומר, התוצאה הראשונה היא 0, התוצאה השנייה היא 1 וכן הלאה.

הפרמטר start פועל במקרים הבאים בשילוב עם הפרמטר num כדי לקבוע אילו תוצאות חיפוש יוחזרו. לתשומת ליבכם: לא יוחזרו יותר מ-1,000 תוצאות לשאילתה כלשהי, גם אם יותר מ-1,000 מסמכים תואמים לשאילתה. לכן, אם מגדירים הפעלה ל-1,000 או יותר, לא יתקבלו תוצאות.

דוגמאות start=10

מיון
תיאור

אופציונלי. הפרמטר sort מציין שהתוצאות ימוינו לפי הביטוי שצוין. לדוגמה, מיון לפי תאריך.

דוגמאות

sort=date


U
תיאור

אופציונלי. הפרמטר ud מציין האם תגובת ה-XML צריכה לכלול את כתובת האתר בקידוד IDN של תוצאת החיפוש. קידוד IDN (International Domain Name) מאפשר הצגת דומיינים באמצעות שפות, לדוגמה:

http://www.花井鮨.com

הערכים החוקיים לפרמטר הזה הם 1 (ברירת המחדל), כלומר תוצאת ה-XML צריכה כוללות כתובות URL בקידוד IDN ו-0, כלומר תוצאת ה-XML לא יכולה לכלול קידוד IDN כתובות URL. אם הפרמטר ud מוגדר לערך 1, כתובת ה-URL בקידוד IDN תופיע בתג UD בתוצאות ה-XML.

אם הפרמטר ud מוגדר ל-0, כתובת ה-URL בדוגמה שלמעלה תהיה מוצג כ:

http://www.xn--elq438j.com.

הערה: זוהי תכונת בטא.

דוגמאות q=google&ud=1

הפרמטרים הנוספים של שאילתות שמפורטים מתחת לתמונה רלוונטיים לשאילתות של חיפוש מתקדם. כששולחים חיפוש מתקדם, הערכים של כמה פרמטרים (למשל, as_eq, as_epq, as_oq וכדומה) משוקללים בשאילתה מונחים לחיפוש. תמונה שבה מוצג הדף 'חיפוש מתקדם' של Google. בתמונה מופיע השם של פרמטר החיפוש המתקדם כתוב בטקסט אדום בתוך או לידו השדה בדף שאליו הפרמטר תואם.



פרמטרים של שאילתות חיפוש מתקדם

as_dt
תיאור

אופציונלי. הפרמטר as_dt קובע אם כדי לכלול או להחריג תוצאות מהאתר שמופיע בפרמטר as_sitesearch. הערכים i ו-e מציינים הכללה והחרגה בהתאמה.

דוגמאות as_dt=i,as_dt=e

as_epq
תיאור

אופציונלי. הפרמטר as_epq מזהה שכל המסמכים בתוצאות החיפוש חייבים להכיל. אפשר להשתמש גם במונח השאילתה חיפוש לביטוי כדי לחפש ביטוי.

דוגמאות as_epq=abraham+lincoln

as_eq
תיאור

אופציונלי. הפרמטר as_eq מזהה מילה או ביטוי שלא אמורים להופיע באף מסמך בחיפוש תוצאות. אפשר גם להשתמש בשאילתה Exclude (החרגה) כדי להבטיח שמילה או ביטוי מסוימים לא יופיעו בקבוצה של תוצאות חיפוש.

דוגמאות

q=bass&as_eq=music.


as_lq
תיאור

אופציונלי. הפרמטר as_lq מציין כל תוצאות החיפוש צריכות להכיל קישור לכתובת URL מסוימת. אפשר גם להשתמש במונח השאילתה link: לסוג השאילתה הזה.

דוגמאות

as_lq=www.google.com


as_nlo
תיאור

אופציונלי. הפרמטר as_nlo מציין את ערך ההתחלה של טווח חיפוש. כדי לצרף חיפוש כולל, צריך להשתמש ב-as_nlo וב-as_nhi טווח של as_nlo...as_nhi לשאילתה.

דוגמאות

טווח החיפוש שמגדירים הוא 5 עד 10, כולל:

as_nlo=5&as_nhi=10

as_nhi
תיאור

אופציונלי. הפרמטר as_nhi מציין את הערך הערך הסופי של טווח החיפוש. צריך להשתמש ב-as_nlo וב-as_nhi כדי לצרף טווח החיפוש הכולל של as_nlo...as_nhi לשאילתה.

דוגמאות

טווח החיפוש שמגדירים הוא 5 עד 10, כולל:

as_nlo=5&as_nhi=10

as_oq
תיאור

אופציונלי. הפרמטר as_oq מספק מונחי חיפוש נוספים שאפשר לבדוק במסמך, שבהם כל מסמך בתוצאות החיפוש חייב להכיל לפחות אחד מונחי חיפוש. אפשר גם להשתמש במונח השאילתה או בוליאני כדי: שאילתה מהסוג הזה.

דוגמאות

q=vacation&as_oq=London+Paris


as_q
תיאור

אופציונלי. הפרמטר as_q מספק חיפוש כדי לחפש אותם במסמך. גם הפרמטר הזה נמצא בשימוש נפוץ כדי לאפשר למשתמשים לציין מונחים נוספים לחיפוש בתוך קבוצה מתוצאות החיפוש.

דוגמאות

q=president&as_q=John+Adams


as_qdr
תיאור

אופציונלי. הפרמטר as_qdr מבקש חיפוש תוצאות מתקופת זמן שצוינה (טווח תאריכים מהיר). הערכים הבאים נתמכים:

התוצאות של d[number] בקשות מתוך מספר הימים האחרונים שצוין.
w[number] תוצאות של בקשות ממספר השבועות האחרונים שצוינו.
m[number] תוצאות של בקשות ממספר החודשים האחרונים שצוין.
y[number] תוצאות הבקשות ממספר השנים שצוינו.

דוגמאות

בדוגמה הבאה אנחנו מבקשים תוצאות מהשנה האחרונה:

as_qdr=y

בדוגמה הבאה מבקשים תוצאות מ-10 הימים האחרונים:

as_qdr=d10

as_sitesearch
תיאור

אופציונלי. הפרמטר as_sitesearch מאפשר לציין שכל תוצאות החיפוש צריכות להיות דפים מאתר נתון. כשמגדירים את הפרמטר as_dt, אפשר להשתמש בו גם כדי להחריג דפים מאתר מסוים מהגדרות החיפוש.

דוגמאות

q=vacation&as_sitesearch=www.google.com


תנאים מיוחדים לשאילתות

Google WebSearch מאפשר להשתמש במספר מונחי שאילתה מיוחדים גישה ליכולות נוספות של מנוע החיפוש של Google. האלה צריך לכלול מונחי שאילתות מיוחדים בערך של פרמטר הבקשה q. כמו מונחי שאילתה אחרים, מונחי שאילתה מיוחדים צריכים להיות מסומנים בתו בריחה (escape) בכתובת URL. א' מספר מונחי השאילתה המיוחדים מכילים נקודתיים (:). התו הזה חייב להיות גם בכתובת URL עם תו בריחה (escape), הערך של כתובת ה-URL שמסומנת בתו בריחה (escape) הוא %3A.

קישורים חוזרים [link:]
תיאור

מונח השאילתה link: מאחזר את הקבוצה של דפי אינטרנט שמקשרות לכתובת URL מסוימת. שאילתת החיפוש צריכה להיות בפורמט link:URL ללא רווח בין מונח השאילתה link: לבין כתובת ה-URL.

הגרסה של link:, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא link%3A.

אפשר גם להשתמש בבקשה as_lq כדי לשלוח בקשת link:.

הערה: לא ניתן לציין מונחי שאילתה אחרים כאשר באמצעות link:.

דוגמאות

http://www.google.com/search?q=link%3Awww.example.com


חיפוש בוליאני OR [ או ]
תיאור

מונח השאילתה OR מאחזר מסמכים שכוללים אחד מסדרה של (שני מונחי שאילתה או יותר). כדי להשתמש בשאילתה OR מונח חיפוש, צריך להזין את המונח OR, באותיות רישיות באותיות, בין כל אחד מהמונחים בסדרה.

אפשר גם להשתמש בבקשה as_oq פרמטר לחיפוש של מונח כלשהו בקבוצת מונחים.

הערה: אם בקשת החיפוש מציין את השאילתה "לונדון+OR+פריז", תוצאות החיפוש יכללו מסמכים שמכילים לפחות אחת משתי המילים האלה. במקרים מסוימים, מסמכים שבתוצאות החיפוש עשויים להכיל את שתי המילים.

דוגמאות

מחפשים את לונדון או פריז:

קלט של משתמשים:london OR paris מונח השאילתה:q=london+OR+paris

מחפשים חופשה וגם את לונדון או פריז:

מונח השאילתה:q=vacation+london+OR+paris

מחפשים חופשה ואחת מלונדון, פריז או שוקולדים:

מונח השאילתה:  q=vacation+london+OR+paris+OR+chocolates

מחפשים חופשה ושוקולדים וגם לונדון או פריז, עם המשקל הקטן ביותר שניתן לשוקולדים:

מונח השאילתה:  q=vacation+london+OR+paris+chocolates

חיפוש חופשה, שוקולדים ופרחים במסמכים לכלול גם את לונדון או פריז:

מונח השאילתה:  q=vacation+london+OR+paris+chocolates+flowers

מחפשים חופשה ואחת מלונדון או פריז וגם מחפשים לאחד משוקולד או לפרחים:

מונח השאילתה:  q=vacation+london+OR+paris+chocolates+OR+flowers

החרגת מונח שאילתה [-]
תיאור

מונח השאילתה 'החרגה (-)' מגביל את התוצאות של לחיפוש ספציפי למסמכים שלא מכילים מילה או ביטוי מסוימים. כדי להשתמש במונח 'החרגת שאילתה', צריך להקדים את המילה או הביטוי כך שיוחרג מהמסמכים התואמים עם "-" (סימן חיסור).

הגרסה של -, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא %2D.

מונח השאילתה מוחרג שימושי כאשר למונח החיפוש יש יותר ממשמעות אחת. לדוגמה, המילה "בס" יכול להחזיר תוצאות על דגים או על מוזיקה. אם חיפשת מסמכים על דג, ניתן להחריג מסמכים על מוזיקה בתוצאות החיפוש באמצעות המונח 'החרגת שאילתה'.

אפשר גם להשתמש בבקשה as_eq פרמטר להחרגה של מסמכים שתואמים למילה מסוימת או לביטוי מסוים מתוצאות החיפוש.

דוגמאות קלט של משתמשים: bass -music
מונח השאילתה: q=bass+%2Dmusic

החרגת סוגי קבצים [ -filetype: ]
תיאור

מונח השאילתה -filetype: לא כולל מסמכים עם סיומת קובץ מסוימת, למשל "pdf." או " .doc" מחיפוש תוצאות. שאילתת החיפוש צריכה להיות בפורמט -filetype:EXTENSION ללא רווח בין מונח השאילתה -filetype: מהתוסף שצוין.

הגרסה של -filetype:, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא %2Dfiletype%3A.

הערה: אפשר להחריג כמה סוגי קבצים מתוצאות החיפוש על ידי הוספת עוד שאילתת -filetype: מונחים לשאילתה. צריך להיות לך מונח שאילתה אחד (-filetype:) בשאילתת החיפוש עבור כל סיומת קובץ שצריך להחריג מתוצאות החיפוש.

סוגי הקבצים ש-Google תומכת בהם:

  • Adobe Portable Document Format (pdf)
  • Adobe PostScript (ps)
  • לוטוס 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • loss WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (שבועות, wps, wdb)
  • Microsoft Write (wri)
  • תבנית טקסט עשיר (rtf)
  • Shockwave Flash (swf)
  • טקסט (ans, txt).

יכול להיות שבעתיד יתווספו סוגי קבצים נוספים. גרסה עדכנית תמיד אפשר למצוא את הרשימה בשאלות הנפוצות על סוגי קבצים של Google.

דוגמאות

בדוגמה הזו הוחזרו מסמכים שמוזכרים בהם "Google" אבל זה אינם מסמכי PDF:
q=Google+%2Dfiletype%3Apdf

בדוגמה הזו הוחזרו מסמכים שמוזכרים בהם "Google" אבל לא כולל מסמכי PDF ו-Word:
q=Google+%2Dfiletype%3Apdf+%2Dfiletype%3Adoc


סינון סוגי קבצים [ filetype: ]
תיאור

מונח השאילתה filetype: מגביל את תוצאות החיפוש ל- מסמכים עם סיומת קובץ מסוימת, לדוגמה "pdf." או 'doc.'. שאילתת החיפוש צריכה להיות בפורמט filetype:EXTENSION עם אין רווח בין מונח השאילתה filetype: לבין הפרמטר שצוין לתוסף.

הגרסה של filetype:, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא filetype%3A.

אפשר להגביל את החיפוש תוצאות למסמכים התואמים לאחת מסיומות הקבצים של כמה סיומות באמצעות הוספת עוד מונחי שאילתה filetype: לשאילתה. כל סיומת קובץ שאמורה להיכלל בתוצאות החיפוש צריכה לכלול מונח שאילתה אחד (filetype:) בשאילתת החיפוש. אם מספר מונחי שאילתה filetype: צריך להפריד ביניהם באמצעות מונח השאילתה OR.

כברירת מחדל, תוצאות החיפוש כוללים מסמכים עם סיומת קובץ כלשהי.

סוגי הקבצים ש-Google תומכת בהם:

  • Adobe Portable Document Format (pdf)
  • Adobe PostScript (ps)
  • לוטוס 1-2-3 (wk1, wk2, wk3, wk4, wk5, wki, wks, wku)
  • loss WordPro (lwp)
  • Macwrite (mw)
  • Microsoft Excel (xls)
  • Microsoft PowerPoint (ppt)
  • Microsoft Word (doc)
  • Microsoft Works (שבועות, wps, wdb)
  • Microsoft Write (wri)
  • תבנית טקסט עשיר (rtf)
  • Shockwave Flash (swf)
  • טקסט (ans, txt).

יכול להיות שבעתיד יתווספו סוגי קבצים נוספים. גרסה עדכנית תמיד אפשר למצוא את הרשימה בשאלות הנפוצות על סוגי קבצים של Google.

דוגמאות

בדוגמה הזו מוחזרות מסמכי PDF שבהם מצוין "Google":
q=Google+filetype%3Apdf

בדוגמה הזו מוחזרות מסמכי PDF ו-Word שמזכירים "Google":
q=Google+filetype%3Apdf+OR+filetype%3Adoc


הכללת מונח השאילתה [+]
תיאור

מונח השאילתה (+) מציין שמילה או ביטוי חייבת להתרחש בכל המסמכים שכלולים בתוצאות החיפוש. כדי להשתמש כלול מונח שאילתה, עליך להקדים את המילה או הביטוי שחייבים להיות נכלל בכל תוצאות החיפוש עם הסימן "+" (סימן פלוס).

הגרסה של + (סימן פלוס) שמסומנת בתו מילוט (escape) היא %2B.

צריך להשתמש במילה + לפני מילה נפוצה ש-Google בדרך כלל נמחק לפני זיהוי תוצאות החיפוש.

דוגמאות קלט של משתמשים: Star Wars Episode +I
מונח השאילתה: q=Star+Wars+Episode+%2BI

קישורים בלבד חיפוש, כל המונחים [ allinlinks: ]
תיאור

עבור מונח השאילתה allinlinks: נדרשים מסמכים ב- תוצאות חיפוש שיכללו את כל המילים שבשאילתת החיפוש בכתובת ה-URL קישורים. הפורמט של שאילתת החיפוש צריך להיות allinlinks: ואחריה המילים בשאילתת החיפוש.

אם שאילתת החיפוש כוללת את השאילתה allinlinks: מונח, Google תבדוק רק את קישורי כתובות ה-URL במסמכים בשאילתת החיפוש, תוך התעלמות מטקסט אחר במסמכים, ואת כתובות האתרים של כל מסמך. שימו לב שהמסמך כתובת ה-URL שונה מקישורי ה-URL שנכללים במסמך.

הגרסה של allinlinks:, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא allinlinks%3A.

דוגמאות קלט של משתמשים:allinlinks: Google search
מונח השאילתה:q=allinlinks%3A+Google+search

חיפוש ביטויים
תיאור

מונח השאילתה לחיפוש (") מאפשר לכם לחפש של משפטים מלאים על ידי הקפצת הביטויים במירכאות או באמצעות לחבר אותם באמצעות מקפים.

הגרסה של " (מירכאות) שמסומנת בתו בריחה (escape) היא %22.

חיפושי ביטויים שימושיים במיוחד אם אתה מבצע חיפוש ציטוטים מפורסמים או שמות עצם פרטיים.

אפשר גם להשתמש בבקשה as_epq כדי לשלוח חיפוש של ביטוי.

דוגמאות קלט של משתמשים:"Abraham Lincoln"
מונח השאילתה: q=%22Abraham+Lincoln%22

חיפוש טקסט בלבד, כל המונחים [allintext:]
תיאור

עבור מונח השאילתה allintext: נדרש כל מסמך ב- תוצאות חיפוש כך שיכללו את כל המילים בשאילתת החיפוש בגוף המסמך. השאילתה צריכה להיות בפורמט allintext: ואחריה המילים בשאילתת החיפוש.

אם שאילתת החיפוש כוללת את השאילתה allintext: מונח, Google תבדוק רק את הטקסט בגוף המסמכים בשאילתת החיפוש, תוך התעלמות מקישורים במסמכים האלה, כותרות וכתובות URL של מסמכים.

הגרסה של allintext:, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא allintext%3A.

דוגמאות הדוגמה הזו מציינת שהמילים "Google" ועל 'חיפוש' חייב להופיע בגוף כל המסמכים הכלולים בתוצאות החיפוש:
קלט של משתמשים:allintext:Google search
מונח השאילתה:q=allintext%3AGoogle+search

חיפוש כותרת, מונח יחיד [intitle:]
תיאור

מונח השאילתה intitle: מגביל את תוצאות החיפוש ל- מסמכים שמכילים מילה מסוימת בכותרת המסמך. הפורמט של שאילתת החיפוש צריכה להיות intitle:WORD ללא רווח בין מונח השאילתה intitle: לבין המילה הבאה.

הערה: אפשר לציין עוד ממילה אחת שחייבת להיכלל בכותרת המסמך באמצעות הצבת מונח השאילתה intitle: לפני כל מילה כזו. אפשר אפשר להשתמש גם במונח השאילתה allintitle: כדי לציין שכל מילות השאילתה חייבות להיכלל בכותרות של מסמכים שמופיעים בתוצאות החיפוש.

הגרסה של intitle:, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא intitle%3A.

דוגמאות

הדוגמה הזו מציינת שהמילה "Google" חייב להופיע ב: הכותרות של כל מסמך בתוצאות החיפוש, והמילה "search" חייב להופיע במקום כלשהו בכותרות, בכתובות URL, בקישורים או בגוף הטקסט מהמסמכים האלה:
קלט של משתמשים:intitle:Google search
מונח השאילתה:q=intitle%3AGoogle+search


חיפוש כותרת, כל המונחים [allintitle:]
תיאור

מונח השאילתה allintitle: מגביל את תוצאות החיפוש ל- מסמכים שמכילים את כל מילות השאילתה בכותרת המסמך. שפת תרגום צריך להשתמש במונח השאילתה allintitle:, כולל "allintitle: " ב בתור התחלה של שאילתת החיפוש.

הערה: ההוספה של allintitle: בתחילת שאילתת חיפוש מקבילה להזנה של intitle: לפני כל מילה בחיפוש. שאילתה.

הגרסה של allintitle: שמסומנת בתו בריחה (escape) בכתובת ה-URL היא allintitle%3A.

דוגמאות

הדוגמה הזו מציינת שהמילים Google ועל 'חיפוש' חייבות להופיע בכותרות של כל המסמכים בתוצאות החיפוש:
קלט של משתמשים: allintitle: Google search
מונח השאילתה: q=allintitle%3A+Google+search


URL Search, מונח יחיד [inurl:]
תיאור

מונח השאילתה inurl: מגביל את תוצאות החיפוש ל- מסמכים שמכילים מילה מסוימת בכתובת ה-URL של המסמך. הפורמט של שאילתת החיפוש צריכה להיות inurl:WORD ללא רווח בין מונח השאילתה inurl: לבין המילה הבאה.

השאילתה inurl: הפרמטר מתעלם מסימני פיסוק ומשתמש רק במילה הראשונה שמופיעה אחרי האופרטור inurl:. ניתן לציין יותר ממילה אחת שחובה לכלול כתובת ה-URL של המסמך על-ידי הוספת מונח השאילתה inurl: לפני כל מילה כזו. אפשר גם להשתמש במונח השאילתה allinurl: כדי לציין שחובה לכלול את כל מילות השאילתה בכתובות ה-URL. של מסמכים שמופיעים בתוצאות החיפוש.

הגרסה של inurl:, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא inurl%3A.

דוגמאות

הדוגמה הזו מציינת שהמילה "Google" חייב להופיע ב: כתובות ה-URL של מסמכים כלשהם בתוצאות החיפוש, והמילה "חיפוש" חייב להופיע במקום כלשהו בכותרות, בכתובות ה-URL, בקישורים או בגוף הטקסט מסמכים:
קלט של משתמשים: inurl:Google search
מונח השאילתה: q=inurl%3AGoogle+search


חיפוש כתובות URL, כל המונחים [allinurl:]
תיאור

מונח השאילתה allinurl: מגביל את תוצאות החיפוש ל- מסמכים שמכילים את כל מילות השאילתה בכתובת ה-URL של המסמך. שפת תרגום צריך להשתמש במונח השאילתה allinurl:, צריך לכלול את המונח allinurl: בהתחלה של שאילתת החיפוש.

מונח השאילתה allinurl: מתעלם מסימני פיסוק, לכן הוא פועל רק על מילים, ולא על כתובת URL רכיבים. לדוגמה, allinurl: uk/scotland יגביל את התוצאות למסמכים שמכילים את המילים 'uk' ו'סקוטלנד' בכתובות ה-URL שלהם, אבל היא לא תדרוש ששתי המילים האלה יופיעו באופן ספציפי כלשהו או שהם מופרדים בקו נטוי.

הגרסה של allinurl:, שמסומנת בתו בריחה (escape) באמצעות כתובת URL היא allinurl%3A.

דוגמאות

הדוגמה הזו מציינת שהמילים Google ועל 'חיפוש' חייבות להופיע בכתובות ה-URL של כל המסמכים בתוצאות החיפוש:
קלט של משתמשים: allinurl: Google search
מונח השאילתה: q=allinurl%3A+Google+search



פרטי מסמך אינטרנט [info:]
תיאור

מונח השאילתה info: מאחזר מידע כללי על כתובת אתר, כל עוד כתובת האתר כלולה באינדקס החיפוש של Google. שאילתת החיפוש צריכה להיות בפורמט info:URL ללא רווח בין מונח השאילתה info: לבין כתובת ה-URL.

הגרסה של info: שמסומנת בתו בריחה (escape) היא info%3A.

הערה: לא ניתן לציין מונחי שאילתה אחרים כאשר באמצעות info:.

דוגמאות קלט של משתמשים: info:www.google.com
מונח השאילתה: q=info%3Awww.google.com

שאילתות תמונה לדוגמה

הדוגמאות הבאות מראות כמה בקשות HTTP של תמונות כדי להמחיש את אופן השימוש בפרמטרים שונים של שאילתה. ההגדרות לפרמטרים השונים של השאילתה מופיעות בקטעים 'הגדרות פרמטרים של שאילתות תמונה' במסמך זה.

הבקשה הזו מבקשת את 5 התוצאות הראשונות (start=0&num=5) עבור מונח השאילתה "קוף" (q=monkey), מסוג קובץ .png לבסוף, השאילתה מציינת ערכים לפרמטרים client, output ו-cx, וכל שלושתם נדרשים.

http://www.google.com/cse?
  searchtype=image
  start=0
  &num=5
  &q=monkey
  &as_filetype=png
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

פרמטרים של שאילתת חיפוש תמונות

as_filetype
תיאור

אופציונלי. מחזירה תמונות מסוג שצוין. הערכים המותרים הם: bmp, gif, png, jpg ו-svg.

דוגמאות q=google&as_filetype=png

imgsz
תיאור

אופציונלי. החזרת תמונות בגודל שצוין, כשהגודל יכול להיות אחד מהערכים הבאים:

  • icon (קטן)
  • small|medium|large|xlarge (בינוני)
  • xxlarge (גדול)
  • huge (גדול מאוד)

דוגמאות q=google&as_filetype=png&imgsz=icon

סוג תמונה
תיאור

אופציונלי. מחזירה תמונות מסוג, שיכולות להיות אחת מהאפשרויות הבאות:

  • clipart (אק"ג)
  • face (פנים)
  • lineart (ליניארית)
  • news (חדשות)
  • photo (תמונה)

דוגמאות q=google&as_filetype=png&imgtype=photo

imgc
תיאור

אופציונלי. מחזירה תמונות בשחור-לבן, גווני אפור או תמונות צבעוניות:

  • mono (שחור ולבן)
  • gray (גווני אפור)
  • color (צבע)

דוגמאות q=google&as_filetype=png&imgc=gray

imgcolor
תיאור

אופציונלי. מחזירה תמונות של צבע דומיננטי ספציפי:

  • yellow
  • green
  • teal
  • blue
  • purple
  • pink
  • white
  • gray
  • black
  • brown
דוגמאות q=google&as_filetype=png&imgcolor=yellow

as_rights
תיאור

אופציונלי. מסננים בהתאם לרישוי. הערכים הנתמכים כוללים:

  • cc_publicdomain
  • cc_attribute
  • cc_sharealike
  • cc_noncommercial
  • cc_nonderived

דוגמאות q=cats&as_filetype=png&as_rights=cc_attribute

מגבלות של בקשות

התרשים הבא מפרט את המגבלות על בקשות החיפוש שליחה ל-Google:

רכיב הגבלה תגובה
אורך בקשת החיפוש 2,048 בייטים  
מספר מונחי השאילתה 10 כוללת מונחים בפרמטרים הבאים: q, as_epq, as_eq, as_lq, as_oq, as_q
מספר התוצאות 20 אם תגדירו את הפרמטר num למספר גדול מ-20, יוחזרו רק 20 תוצאות. שפת תרגום כדי לקבל עוד תוצאות, צריך לשלוח כמה בקשות מעלים את הערך של הפרמטר start ב- בכל בקשה.

הצגת שאילתות ותוצאות בינלאומיות

שירות Google WebSearch מאפשר לך לחפש מסמכים בשפות מרובות. אפשר לציין את קידוד התווים לשמש לפירוש בקשת ה-HTTP ולקידוד תגובת ה-XML (באמצעות החיפוש ie ו-oe ). אפשר גם לסנן את התוצאות כך שיכללו מסמכים בלבד שכתוב בשפות מסוימות.

בקטעים הבאים נדון בבעיות שקשורות לחיפוש ב- במספר שפות:

קידוד תווים

השרתים שולחים נתונים, כמו דפי אינטרנט, לסוכני משתמש כמו בדפדפנים בתור רצף של בייטים מקודדים. סוכן המשתמש מפענח אותו לאחר מכן את הבייטים לרצף של תווים. כששולחים בקשות אל שירות WebSearch, ניתן לציין את סכימות הקידוד עבור את שאילתת החיפוש ואת תגובת ה-XML שתקבלו.

אפשר להשתמש בפרמטר של הבקשה ie כדי לציין את מנגנון הקידוד של התווים בבקשת ה-HTTP. אפשר להשתמש גם בפרמטר oe כדי לציין את הקידוד ש-Google צריכה להשתמש בה כדי לקודד את תגובת ה-XML. אם אתם באמצעות סכימת קידוד אחרת מ-ISO-8859-1 (או latin1), חשוב לציין את הערכים הנכונים לפרמטרים ie ו-oe.

הערה: אם אתם מספקים פונקציונליות חיפוש עבור כמה שפות, מומלץ להשתמש בערך הקידוד utf8 (UTF-8) גם לפרמטר ie וגם לפרמטר oe.

אפשר לעיין בקטע התו נספח בנושא סכימות קידוד לרשימה מלאה של הערכים אפשר להשתמש בהם בפרמטרים ie ו-oe.

מידע כללי נוסף על קידוד תווים זמין בכתובת http://www.w3.org/TR/REC-html40/charset.html.

שפות ממשק

אפשר להשתמש בפרמטר של הבקשה hl כדי לזהות את השפה של הממשק הגרפי. ערך הפרמטר hl עשוי להשפיע על תוצאות החיפוש ב-XML, במיוחד שאילתות בינלאומיות כאשר הגבלת השפה (באמצעות הפרמטר lr) לא מצוינת באופן מפורש. בתרחישים כאלה במקרים מסוימים, הפרמטר hl עשוי לקדם תוצאות חיפוש באותה שפה כמו שפת הקלט של המשתמש.

מומלץ להגדיר במפורש את הפרמטר hl בתוצאות החיפוש כדי להבטיח ש-Google תבחר תוצאות חיפוש לכל שאילתה.

כאן מפורטים ממשק נתמך. הקטע 'שפות' מציג רשימה מלאה של הערכים החוקיים לפרמטר hl.

חיפוש מסמכים שנכתבו בשפות מסוימות

אפשר להשתמש בפרמטר הבקשה lr כדי להגביל את תוצאות החיפוש למסמכים שנכתבות בשפה מסוימת שפה או קבוצת שפות.

הפרמטר lr תומך באופרטורים בוליאניים כדי לאפשר לציין שפות מרובות שצריך לכלול (או לא לכלול) בחיפוש תוצאות.

הדוגמאות הבאות מראות כיצד ניתן להשתמש באופרטורים בוליאניים כדי לבקש מסמכים ב בשפות שונות.

עבור מסמכים שנכתבו ביפנית:

lr=lang_jp

למסמכים שנכתבו באיטלקית או בגרמנית:

lr=lang_it|lang_de

עבור מסמכים שלא נכתבו בהונגרית או בצ'כית:

lr=(-lang_hu).(-lang_cs)

ניתן לעיין באוסף השפות הקטע 'ערכים' לעיון ברשימה מלאה של הערכים האפשריים לפרמטר lr ולפרמטר בוליאני קטע אופרטורים לדיון מקיף לגבי השימוש אופרטורים.

סינית פשוטה וסינית מסורתית הן שתי גרסאות כתיבה של השפה הסינית. אפשר לכתוב את אותו קונספט אחר באופן שונה לכל וריאנט. בהינתן שאילתה באחת מהווריאנטים, שירות WebSearch יכול להחזיר תוצאות שכוללות דפים בשני וריאציות של אותו מודל.

כדי להשתמש בתכונה הזו:

  1. מגדירים את פרמטר הבקשה c2coff ל-0
    וגם
  2. מבצעים את אחת מהפעולות האלה:
    • אין להגדיר את פרמטר הבקשה lr
      או
    • מגדירים את פרמטר הבקשה lr ל-lr=lang_zh-TW|lang_zh-CN

בדוגמה הבאה מוצגים הפרמטרים של השאילתה שצריך לכלול בבקשה לקבלת תוצאות. גם בסינית פשוטה וגם בסינית מסורתית. (שים לב שהמידע הנדרש נוסף, כגון בתור client, לא נכלל בדוגמה).

search?hl=zh-CN
    &lr=lang_zh-TW|lang_zh-CN
    &c2coff=0

סינון תוצאות

Google WebSearch מספק כמה דרכים לסנן את החיפוש תוצאות:

סינון אוטומטי של תוצאות החיפוש

במסגרת המאמצים שלנו לספק את תוצאות החיפוש הרלוונטיות ביותר, Google משתמשת בשתי שיטות לסינון אוטומטי של תוצאות חיפוש נחשבות בדרך כלל לא רצויות:

  • תוכן כפול – אם כמה מסמכים מכילים את אותו מידע, רק המסמך הרלוונטי ביותר באותה קבוצה הוא כלולים בתוצאות החיפוש.

  • עומס ממארח – אם יש הרבה תוצאות חיפוש באותו אתר, ייתכן ש-Google לא תציג את כל התוצאות מהאתר הזה, או הצגת התוצאות במיקום נמוך יותר ב
    את הדירוג בהשוואה למה שהיה יכול להיות.

מומלץ להשאיר את המסננים האלה מופעלים לבקשות חיפוש אופייניות כיוון שהמסננים משפרים באופן משמעותי את איכות רוב תוצאות החיפוש תוצאות. אבל אפשר לעקוף את המסננים האוטומטיים האלה על ידי הגדרת הערך 0 בפרמטר השאילתה filter לבקשת החיפוש.

סינון לפי שפה ומדינה

שירות Google WebSearch מחזיר תוצאות מאינדקס ראשי של כל מסמכי האינטרנט. האינדקס הראשי מכיל אוספי משנה של מסמכים שמקובצים לפי מאפיינים מסוימים, כולל שפה ומדינת המוצא.

ניתן להשתמש בפרמטרים של הבקשה lr ו-cr כדי להגביל את תוצאות החיפוש אוספי משנה של מסמכים שנכתבו בשפות מסוימות או מקורם במדינות מסוימות, בהתאמה.

מערכת Google WebSearch קובעת את השפה של מסמך באמצעות ניתוח של:

  • הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
  • מטא תגים של שפה בתוך המסמך
  • השפה הראשית שבה כתוב הטקסט במסמך


מומלץ לעיין גם בהגדרה של הפרמטר lr, בקטע חיפוש מסמכים שנכתבו בשפות ספציפיות והערכים באוסף השפות שיכולים להיות משמש כערכים לפרמטר lr מידע על הגבלת תוצאות על סמך שפה.

מערכת Google WebSearch קובעת את המדינה של מסמך באמצעות ניתוח של:

  • הדומיין ברמה העליונה (TLD) של כתובת ה-URL של המסמך
  • המיקום הגיאוגרפי של כתובת ה-IP של שרת האינטרנט

מומלץ לעיין גם בהגדרה של הפרמטר cr ובאוסף המדינה ערכים שיכולים לשמש כערכים לפרמטר cr לקבלת מידע נוסף על הגבלת התוצאות לפי מדינה המקור.

הערה: אפשר לשלב שפות וערכי מדינה כדי להתאים אישית את תוצאות החיפוש. עבור למשל, אפשר לבקש מסמכים שנכתבו בצרפתית מגיעים מצרפת או קנדה, או לבקש מסמכים מהולנד ולא כתובות באנגלית. הפרמטרים lr ו-cr תומכים שניהם באופרטורים בוליאניים.

סינון תוכן למבוגרים בלבד באמצעות חיפוש בטוח

לקוחות רבים של Google לא רוצים להציג תוצאות חיפוש עבור אתרים שמכילים תוכן למבוגרים בלבד. באמצעות מסנן החיפוש הבטוח שלנו, ניתן לסנן לתוצאות חיפוש שמכילות תוכן למבוגרים בלבד כדי להסיר אותן. המסננים של Google מתבססים על טכנולוגיה קניינית כדי לבדוק מילות מפתח, ביטויים וכתובות URL. אמנם אין מסננים מדויקים ב-100 אחוז, אבל החיפוש הבטוח להסיר מהחיפוש את רוב התוכן למבוגרים בלבד תוצאות.

Google שואפת לשמור על חיפוש בטוח עדכני ומקיף באמצעות סריקה מתמשכת של האינטרנט ושילוב של עדכונים מהצעות של משתמשים.

תכונת החיפוש הבטוח זמינה בשפות הבאות:

הולנדית
אנגלית
צרפתית
גרמנית
איטלקית
פורטוגזית (ברזילאית)
ספרדית
סינית מסורתית

אפשר לשנות את מידת הסינון של Google בתוצאות תוכן למבוגרים בלבד באמצעות פרמטר השאילתה safe. הטבלה הבאה מסבירה את הגדרות החיפוש הבטוח של Google ואיך הן ההגדרות ישפיעו על תוצאות החיפוש שלך:

רמת החיפוש הבטוח תיאור
גבוה הפעלת גרסה מחמירה יותר של החיפוש הבטוח.
בינונית חסימת דפי אינטרנט שמכילים פורנוגרפיה ותוכן מיני בוטה אחר.
מושבתת ללא סינון לפי 'למבוגרים בלבד' תוכן מתוצאות החיפוש.

* הגדרת ברירת המחדל של החיפוש הבטוח מושבתת.

אם החיפוש הבטוח מופעל ומוצאים אתרים שכוללים כדי להציג תוכן פוגעני בתוצאות החיפוש, יש לשלוח אימייל לכתובת safesearch@google.com. יחקור את האתר.

תוצאות XML

תוצאות Google XML DTD

Google משתמשת באותו DTD כדי לתאר את פורמט ה-XML לכל הסוגים של תוצאות החיפוש. רבים מהתגים והמאפיינים רלוונטיים לכל סוגי המשתמשים בסוגי החיפוש. עם זאת, חלק מהתגים רלוונטיים רק לסוגים מסוימים בסוגי החיפוש. כתוצאה מכך, ההגדרות ב-DTD עשויות להיות פחות מגבילות יותר מההגדרות שמפורטות במסמך הזה.

מסמך זה מתאר את ההיבטים הרלוונטיים של DTD ל-WebSearch. כשבוחנים את חותמת הזמן, אם ב-WebSearch, תוכל להתעלם מתגים וממאפיינים שאינם מתועד כאן. אם ההגדרה שונה בין ה-DTD כי העובדה הזו מצוינת במסמך הזה.

Google יכולה להחזיר תוצאות XML עם או בלי הפניה אל את חותמת הזמן העדכנית ביותר DTD הוא מדריך לסיוע למנהלי חיפוש ומנתחי XML מבינים את תוצאות ה-XML של Google. כי ה-XML של Google הדקדוק עשוי להשתנות מעת לעת, לא כדאי להגדיר המנתח להשתמש ב-DTD כדי לאמת כל תוצאת XML.

בנוסף, אל תגדירו את מנתח ה-XML כך שיאחזר את DTD בכל פעם ששולחים בקשת חיפוש. Google מעדכנת את DTD לעיתים רחוקות, והבקשות האלה גורמות לעיכוב ולרוחב פס מיותרים בדרישות שלנו.

Google ממליצה להשתמש בפורמט הפלט xml_no_dtd כדי לקבל תוצאות XML. אם מציינים את פורמט XML פלט בבקשת החיפוש, ההבדל היחיד הוא הכללת השורה הבאה בתוצאות ה-XML:

<!DOCTYPE GSP SYSTEM "google.dtd">

אפשר לגשת למספר DTD העדכני בכתובת http://www.google.com/google.dtd.

לתשומת ליבכם: יכול להיות שלא כל התכונות ב-DTD יהיו זמינות או נתמכות בשלב זה.

מידע על תגובת XML

  • כל ערכי הרכיבים הם HTML תקין שמתאים להצגה, אלא אם צוין אחרת בהגדרות של תגי XML.
  • חלק מערכי הרכיבים הם כתובות URL שצריך לקודד ב-HTML לפני כן הם מוצגים.
  • מנתח ה-XML צריך להתעלם ממאפיינים ומתגים לא מתועדים. כך האפליקציה יכולה להמשיך לפעול ללא שינויים למשל, אם Google מוסיפה עוד תכונות לפלט ה-XML.
  • יש תווים שצריך לסמן בתו בריחה (escape) כשהם נכללים כערכים ב- תגי XML. מעבד ה-XML שלכם צריך להמיר את הישויות האלה בחזרה את התווים המתאימים. אם לא תמירו ישויות באופן תקין, לדוגמה, הדפדפן עשוי לעבד את & בתו '&amp;'. ה-XML מסמכים סטנדרטיים של התווים האלה. התווים האלה בטבלה הבאה:

    תו טפסים מילוט ישות קוד תו
    סימן 'גם' (אמפרסנד) & &amp; &#38;
    גרש ' &apos; &#39;
    מירכאות כפולות " &quot; &#34;
    גדול מ- > &gt; &#62;
    קטן מ- < &lt; &#60;

תוצאות XML לשאילתות חיפוש רגילות ומתקדם

חיפוש רגיל/מתקדם: שאילתה לדוגמה ותוצאת XML

בבקשת WebSearch לדוגמה הזו יש 10 תוצאות (num=10) על מונח החיפוש "socer" (q=socer), זו המילה 'כדורגל' איות שגוי בכוונה עבור הדוגמה הזו).

http://www.google.com/search?
q=socer
&hl=en
&start=10
&num=10
&output=xml
&client=google-csbe
&cx=00255077836266642015:u-scht7a-8i

הבקשה הזו מניבה את תוצאת ה-XML הבאה. שימו לב שיש מספר הערות בתוצאת ה-XML שמציינות היכן תגים מסוימים יופיעו בתוצאה.

<?xml version="1.0" encoding="ISO-8859-1" standalone="no" ?>

<GSP VER="3.2">
<TM>0.452923</TM>
<Q>socer</Q>
<PARAM name="cx" value="00255077836266642015:u-scht7a-8i" original_value="00255077836266642015%3Au-scht7a-8i"/>
<PARAM name="hl" value="en" original_value="en"/>
<PARAM name="q" value="socer" original_value="socer"/>
<PARAM name="output" value="xml" original_value="xml"/>
<PARAM name="client" value="google-csbe" original_value="google-csbe"/>
<PARAM name="num" value="10" original_value="10"/>
<Spelling>
<Suggestion q="soccer"><b><i>soccer</i></b></Suggestion>
</Spelling>
<Context>
<title>Sample Vacation CSE</title>
<Facet>
<FacetItem>
<label>restaurants</label>
<anchor_text>restaurants</anchor_text>
</FacetItem>
<FacetItem>
<label>wineries</label>
<anchor_text>wineries</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>golf_courses</label>
<anchor_text>golf courses</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>hotels</label>
<anchor_text>hotels</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>nightlife</label>
<anchor_text>nightlife</anchor_text>
</FacetItem>
</Facet>
<Facet>
<FacetItem>
<label>soccer_sites</label>
<anchor_text>soccer sites</anchor_text>
</FacetItem>
</Facet>
</Context>
<RES SN="1" EN="10">
<M>6080</M>
/*
* The FI tag after the comment indicates that the result
* set has been filtered. If the number of results were exact, the
* FI tag would be replaced by an XT tag in the same format.
*/
<FI />
<NB>
/*
* Since the request is for the first page of results, the PU tag,
* which contains a link to the previous page of search results,
* is not included in this XML result. If the sample result did include
* a previous page of results, it would be listed here, in the same format
* as the NU tag on the following line
*/
<NU>/search?q=socer&hl=en&lr=&ie=UTF-8&output=xml&client=test&start=10&sa=N</NU>
</NB>
<R N="1">
<U>http://www.soccerconnection.net/</U>
<UE>http://www.soccerconnection.net/</UE>
<T>SoccerConnection.net</T>
<CRAWLDATE>May 21, 2007</CRAWLDATE>
<S><b>soccer</b>; players; coaches; ball; world cup;<b>...</b></S>
<Label>transcodable_pages</Label>
<Label>accessible</Label>
<Label>soccer_sites</Label>
<LANG>en</LANG>
<HAS>
<DI>
<DT>SoccerConnection.net</DT>
<DS>Post your <b>soccer</b> resume directly on the Internet.</DS>
</DI>
<L/>
<C SZ="8k" CID="kWAPoYw1xIUJ"/>
<RT/>
</HAS>
</R>
/*
* The result includes nine more results, each enclosed by an R tag.
*/
</RES>
</GSP>

חיפוש רגיל/מתקדם: תגי XML

תגובות XML לבקשות חיפוש רגילות ולחיפוש מתקדם שתי הבקשות משתמשות באותה קבוצה של תגי XML. תגי ה-XML האלה מוצגים את קוד ה-XML שלמעלה, ומוסבר בטבלאות שלמטה.

תגי ה-XML שבהמשך מסודרים לפי שם התג בסדר אלפביתי, וכל אחד מהם הגדרת התג מכילה תיאור של התג, דוגמה שממחישה איך התג יופיע בתוצאת XML והפורמט של התג תוכן. אם התג הוא תג משנה של תג XML אחר או אם התג כולל תגי משנה או מאפיינים משלו, שהמידע מסופק בו גם בטבלת ההגדרות של התג.

ייתכן שסמלים מסוימים יוצגו לצד תגי משנה מסוימים ב הגדרות בהמשך. לפניכם פירוט של הסמלים והמשמעויות שלהם:

? = תג משנה אופציונלי
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה
א ב מ י G מחצית ט ל נ צפ' פ שאלה R דר' ג U X

anchor_text
הגדרה

התג &lt;anchor_text&gt; מציין את הטקסט שעליך להציג למשתמשים כדי לזהות חידוד התיוג המשויך לקבוצת תוצאות חיפוש. מאז תוויות חידוד להחליף תווים שאינם אלפאנומריים בקווים תחתונים, מציג את הערך של התג <label> בממשק המשתמש. במקום זאת, צריך להציג את הערך התג &lt;anchor_text&gt;.

דוגמה <linked_text>גולף קורסים</linked_text>
תג משנה של FacetItem
פורמט התוכן טקסט

חסום
הגדרה

תג זה כולל את התוכן של בלוק בשורת גוף של תוצאת קידום מכירות. לכל בלוק יש תגי משנה T , U ו-L. תג T שאינו ריק מציין שהבלוק מכיל טקסט. התגים U ו-L שלא ריקים מציינים שהבלוק מכיל קישור (עם כתובת ה-URL שצוינה בתג המשנה U ובטקסט המקושר בתג המשנה L).

תגי משנה T, U, L
תג משנה של BODY_LINE
פורמט התוכן ריק

BODY_LINE
הגדרה

תג זה כולל את התוכן של שורה בגוף התוצאה שמקודמת. כל שורת גוף מורכבת מכמה תגי BLOCK, שמכילים טקסט או קישור עם כתובת URL וטקסט מקושר.

תגי משנה חסימה*
תג משנה של SL_MAIN
פורמט התוכן ריק

C
הגדרה

התג &lt;C&gt; מציין ששירות WebSearch יכול לאחזר גרסה שנשמרה במטמון של כתובת ה-URL של תוצאת החיפוש הזו. אי אפשר לאחזר דפים שנשמרו במטמון באמצעות API בפורמט XML, אבל אפשר להפנות משתמשים לכתובת אחרת אל www.google.com בשביל זה תוכן.

מאפיינים
שם פורמט תיאור
SZ טקסט (מספר שלם + "k") מספק את הגודל של גרסת המטמון של תוצאת החיפוש בקילובייט (KB).
CID טקסט מזהה מסמך במטמון של Google. כדי לאחזר את המסמך מהמטמון, צריך לשלוח מונח חיפוש שנוצר בתור עוקב/ת:
cache:CIDtext:escapedURL

כתובת ה-URL שמסומנת בתו מילוט (escape) זמינה בתג UE.

דוגמה <C SZ="6k" CID=&quot;kvOXK_cYSSgJ&quot; />
תג משנה של יש
פורמט התוכן ריק

C2C
הגדרה התג <C2C> מציין התוצאה מתייחסת לדף בסינית מסורתית. התג הזה מופיעה רק כאשר 'פשוטה' ו'מסורתית' חיפוש סינית מופעל. אפשר לקרוא מידע נוסף על הפעלה של הפרמטר c2coff בהגדרת פרמטר השאילתה. השבתת התכונה הזו.
פורמט התוכן טקסט

הקשר
הגדרה

התג &lt;Context&gt; כולל רשימה של תוויות חידוד המשויכות לקבוצה של תוצאות חיפוש.

דוגמה &lt;Context&gt;
תגי משנה title, Facet+
פורמט התוכן מאגר

תכנון
הגדרה

התג &lt;CRAWLDATE&gt; מזהה את התאריך שבו הדף נסרק לאחרונה. לא מוחזר CRAWLDATE עבור כל דף תוצאות חיפוש.

דוגמה <CRAWLDATE>21 במאי, 2005</CRAWLDATE>
תג משנה של R
פורמט התוכן טקסט

DI
הגדרה

התג &lt;DI&gt; כולל את פרויקט Open Directory פרטי הקטגוריה (ODP) לתוצאת חיפוש יחידה.

דוגמה &lt;DI&gt;
תגי משנה DT?, DS?
תג משנה של יש
פורמט התוכן ריק

DS
הגדרה

התג &lt;DS&gt; מספק את הסיכום שרשום עבור בקטגוריה אחת בספריית ה-ODP.

דוגמה <DS>פרסם את &lt;b&gt;soccer&lt;/b&gt; להמשיך ישירות במכשיר אינטרנט.</DS>
תג משנה של DI
פורמט התוכן טקסט (עשוי להכיל HTML)

DT
הגדרה

התג &lt;DT&gt; מספק את הכותרת של רכיב הקטגוריה שמופיעה בספריית ODP.

דוגמה &lt;DT&gt;SoccerConnection.net&lt;/DT&gt;
תג משנה של DI
פורמט התוכן טקסט (עשוי להכיל HTML)

מאפיין
הגדרה

התג <Facet> מכיל קיבוץ לוגי של תגי &lt;FacetItem&gt;. אפשר יוצרים הקבוצות האלה באמצעות Programmable Search Engine פורמט של מפרט XML של המנוע. אם לא תיצור את התגים האלה קיבוצים, התוצאות_xml_tag_Context><Context> התג להכיל לארבעה תגי <Facet>. הפריטים שבתוך כל תג <Facet> יקובצו למטרות תצוגה, אבל יכול להיות שלא יהיה להם ערך לוגי. קשר גומלין.

דוגמה <Facet>
תגי משנה FacetItem+, title+
תג משנה של הֶקשר
פורמט התוכן מאגר

FacetItem
הגדרה

התג &lt;FacetItem&gt; כולל את המידע על תווית חידוד שמשויכת לקבוצה של תוצאות חיפוש.

דוגמה &lt;FacetItem&gt;
תגי משנה label, anchor_text+
תג משנה של היבט
פורמט התוכן FacetItem

FI
הגדרה התג &lt;FI&gt; משמש כדגל שמציין אם בוצע סינון מסמכים עבור החיפוש. פרטים נוספים זמינים בקטע סינון אוטומטי במסמך הזה לקבלת מידע נוסף על תוצאות החיפוש של Google מסננים.
דוגמה <FI /
תג משנה של רזולוציה
פורמט התוכן ריק

GSP
הגדרה

התג &lt;GSP&gt; כולל את כל הנתונים שמוחזרים בתוצאות חיפוש XML ב-Google. 'GSP' תואם לערך ראשי תיבות של 'פרוטוקול החיפוש של Google'.

מאפיינים
שם פורמט תיאור
ור טקסט (מספר שלם) המאפיין VER מציין את הגרסה של פלט תוצאות החיפוש. גרסת הפלט הנוכחית היא 3.2.
דוגמה <GSP VER="3.2">
תגי משנה PARAM+, Q, RES?, TM
פורמט התוכן ריק

יש
הגדרה התג &lt;HAS&gt; כולל מידע על כל חיפוש מיוחד פרמטרים של בקשה שנתמכים בכתובת URL מסוימת.

הערה: ההגדרה של <HAS> עבור WebSearch מגביל יותר מאשר ב-DTD.

תגי משנה DI?, L?, C?, RT?
תג משנה של R

ISURL
הגדרה Google מחזירה את התג &lt;ISURL&gt; אם שאילתת החיפוש המשויכת היא כתובת URL.
תג משנה של GSP
פורמט התוכן ריק

L
הגדרה נוכחות התג &lt;L&gt; מציין ששירות WebSearch יכול למצוא אתרים אחרים שמקשרים אל כתובת ה-URL הזו של תוצאת החיפוש. כדי למצוא אתרים כאלה, אפשר להשתמש במונח השאילתה המיוחד link:.
תג משנה של יש
פורמט התוכן ריק

תווית
הגדרה

התג <label> מציין תווית חידוד שבעזרתו אפשר לסנן את תוצאות החיפוש שמקבלים. כדי להשתמש ב- תווית חידוד, מוסיפים את המחרוזת עוד:[[label tag value]] אל הערך של הפרמטר q בבקשת ה-HTTP שנשלחת ל-Google בתור אפשר לראות בדוגמה הבאה. שימו לב שהערך הזה חייב להיות כתובת ה-URL סומנה בתו בריחה (escape) לפני שליחת השאילתה ל-Google.

This example uses the refinement label golf_courses to
filter search results about Palm Springs:
q=Palm+Springs+more:golf_courses

The URL-escaped version of this query is:
q=Palm+Springs+more%3Agolf_courses

הערה: התג <label> אינו זהה לתג התג &lt;Label&gt;, שמזהה תווית חידוד שמשויכת לכתובת URL מסוימת בתוצאות החיפוש.

דוגמה &lt;label&gt;golf_courses&lt;/label&gt;
תג משנה של FacetItem
פורמט התוכן טקסט

LANG
הגדרה

התג &lt;LANG&gt; מכיל את הניחוש הטוב ביותר של Google לגבי השפה של תוצאת החיפוש.

דוגמה <LANG>iw</LANG>
תג משנה של R
פורמט התוכן טקסט

M
הגדרה

התג &lt;M&gt; מזהה את הסכום הכולל המשוער מספר התוצאות לחיפוש.

הערה: יכול להיות שהאומדן לא מדויק.

דוגמה <M>16200000</M>
תג משנה של רזולוציה
פורמט התוכן טקסט

NB
הגדרה

התג &lt;NB&gt; כולל פרטי ניווט — מקשר לדף הבא של תוצאות החיפוש או לדף הקודם של תוצאות חיפוש - לקבוצת התוצאות.

הערה: התג הזה קיים רק אם יש תוצאות נוספות.

דוגמה &lt;NB&gt;
תגי משנה NU?, PU?
תג משנה של רזולוציה
פורמט התוכן ריק

NU
הגדרה

התג &lt;NU&gt; מכיל קישור יחסי בדף הבא בתוצאות החיפוש.

דוגמה <NU>/search?q=flowers&num=10&hl=iw&ie=UTF-8
&output=xml&client=test&start=10</NU>
תג משנה של NB
פורמט התוכן טקסט (כתובת URL יחסית)

פרמטר
הגדרה

התג &lt;PARAM&gt; מזהה פרמטר קלט שנשלח בבקשת ה-HTTP המשויכת עם תוצאת ה-XML. מידע על הפרמטר נמצא ב- של מאפייני התג - שם, ערך, source_value - ויהיו תג PARAM אחד לכל פרמטר שנשלח בבקשת ה-HTTP.

מאפיינים
שם פורמט תיאור
name טקסט שם הפרמטר של הקלט.
ערך HTML גרסה של הקלט בפורמט HTML כערך הפרמטר.
original_value טקסט הגרסה המקורית של הערך של פרמטר הקלט, שמסומנת בתו בריחה (escape).
דוגמה <PARAM name="cr" value=&quot;countryNZ&quot; source_value="countryNZ" />
תג משנה של GSP
פורמט התוכן רמה למתקדמים מאוד

PU
הגדרה

התג &lt;PU&gt; מספק קישור יחסי הדף הקודם בתוצאות החיפוש.

דוגמה <PU>/search?q=flowers&num=10&hl=iw&output=xml
&client=test&start=10</PU>
תג משנה של NB
פורמט התוכן טקסט (כתובת URL יחסית)

Q
הגדרה

התג &lt;Q&gt; מזהה את שאילתת החיפוש נשלח בבקשת ה-HTTP שמשויכת לתוצאת ה-XML.

דוגמה

<Q>פיצה</Q>

תג משנה של GSP
פורמט התוכן טקסט

R
הגדרה

התג &lt;R&gt; כולל את הפרטים של תוצאת חיפוש בודדת.

הערה: ההגדרה של התג <R> עבור WebSearch מגביל יותר מאשר ב-DTD.

מאפיינים
שם פורמט תיאור
לא טקסט (מספר שלם) מציין את האינדקס (מבוסס 1) של בתוצאות החיפוש.
MIME טקסט ציון סוג ה-MIME של החיפוש תוצאה אחת.
תגי משנה U, UE, T?, CRAWLDATE, S?, LANG?, יש
תג משנה של רזולוציה

תגובה מחדש
הגדרה

התג &lt;RES&gt; כולל את קבוצת הערכים תוצאות חיפוש ופרטים על התוצאות האלה.

מאפיינים
שם פורמט תיאור
SN טקסט (מספר שלם) מציין את האינדקס (מבוסס 1) של תוצאת החיפוש הראשונה שהוחזרה בקבוצת התוצאות הזו.
IW טקסט (מספר שלם) מציין את האינדקס (מבוסס 1) של תוצאת חיפוש שהוחזרה בקבוצת התוצאות הזו.
דוגמה <RES SN="1" EN="10">
תגי משנה M, FI?, XT?, NB?, R*
תג משנה של GSP
פורמט התוכן ריק

S
הגדרה

התג &lt;S&gt; מכיל קטע עבור חיפוש תוצאה שמציגה מונחי שאילתה שמודגשים בגופן מודגש. מעברי השורה הם נכלל בקטע כדי לאפשר גלישת טקסט מתאימה.

דוגמה <S>וושינגטון (CNN) -- הצעת מחיר לסיום עימות בסנאט מעל הנשיא &lt;b&gt;Bush&#39;s&lt;/b&gt; הבחירות המשפטיות לאפשר לחמישה מועמדים להתקדם להצבעה סופית, תוך שמירה על &lt;b&gt;...&lt;b&gt;...&lt;/b&gt;<S>
תג משנה של R
פורמט התוכן טקסט (HTML)

SL_MAIN
הגדרה

תג זה כולל את התוכן של תוצאת קידום מכירות. משמש לניתוח מבצעים. הטקסט המקושר וכתובת ה-URL של קישור הכותרת נמצאים בתגי המשנה T ו-U בהתאמה. השורות של הטקסט והקישורים נמצאות בתגי משנה של BODY_LINE.

תגי משנה BODY_LINE*, T, U
תג משנה של SL_RESULTS
פורמט התוכן ריק

SL_RESULTS
הגדרה

תג מאגר לתוצאות שמקודמות. אחד מהיעדים האלה יופיע בכל פעם שיהיה לכם קידום מכירות בתוצאות החיפוש. תג המשנה SL_MAIN מכיל את נתוני התוצאה הראשית.

תגי משנה SL_MAIN*
תג משנה של R
פורמט התוכן ריק

איות
הגדרה

התג <איות> כולל חלופה הצעת איות לשאילתה שנשלחה. התג הזה מופיע רק ב- בדף הראשון של תוצאות החיפוש. הצעות איות זמינות ב אנגלית, סינית, יפנית וקוריאנית.

הערה: Google תחזיר הצעות איות רק עבור שאילתות שבהן ערך הפרמטר gl נמצא אותיות קטנות.

דוגמה <איות>
תגי משנה הצעה
תג משנה של GSP
פורמט התוכן ריק

הצעה
הגדרה התג &lt;Suggestion&gt; מכיל הצעת איות חלופית לשאילתה שנשלחה. אפשר להשתמש כדי להציע את האיות החלופי למשתמש בחיפוש. הערך של המאפיין q הוא הצעת איות עם קוד בריחה (escape) בכתובת URL, שאפשר להשתמש בה כמונח שאילתה.
מאפיינים
שם אופן הלימוד תיאור
q טקסט המאפיין q מציין גרסה של הצעת האיות שמסומנת בתו בריחה (escape).
דוגמה <הצעה q=&quot;soccer&quot;&gt;&amp;lt;b&amp;gt;&amp;lt;i&amp;gt;soccer&amp;lt;/i&amp;gt;&amp;lt;/b&amp;gt;&lt;/Suggestion&gt;
תג משנה של איות
פורמט התוכן טקסט (HTML)

T
הגדרה התג &lt;T&gt; מכיל את הכותרת של התוצאה.
דוגמה <T>החוף המזרחי של אמיצי פיצה</T>
תג משנה של R
פורמט התוכן טקסט (HTML)

title
הגדרה

כצאצא של &lt;Context&gt;, התג &lt;Context&gt; מכיל את השם של Programmable Search Engine.

כצאצא של <Facet>, התג <title> מספק כותרת לקבוצת מאפיינים.

דוגמה

כצאצא של <Context>: <title>My Search Engine&lt;/title&gt;

כילד/ה של <Facet>: <title>Facet title</title>

תג משנה של Context, Facet
פורמט התוכן טקסט

TM
הגדרה

התג &lt;TM&gt; מזהה את הזמן הכולל של השרת שנדרשת כדי להחזיר תוצאות חיפוש, שנמדדות בשניות.

דוגמה <TM>0.100445</TM>
תג משנה של GSP
פורמט התוכן טקסט (מספר נקודה צפה)

בחינה
הגדרה התג &lt;TT&gt; מספק חיפוש טיפ.
דוגמה <TT>&lt;i&gt;טיפ: לרוב דפדפנים, לחיצה על מקש Return מפיקה את אותן תוצאות כמו לחיצה הלחצן 'חיפוש'.&lt;/i&gt;</TT>
תג משנה של GSP

U
הגדרה התג &lt;U&gt; מספק את כתובת ה-URL של תוצאת החיפוש.
דוגמה &lt;U&gt;http://www.dominos.com/&lt;/U&gt;
תג משנה של R
פורמט התוכן טקסט (כתובת URL מוחלטת)

UD
הגדרה

התג &lt;UD&gt; מספק את הקוד בקידוד IDN (שם דומיין בינלאומי) לתוצאת החיפוש. הערך מאפשר יוצגו בשפות מקומיות. לדוגמה, ניתן לפענח כתובת URL בקידוד IDN http://www.%E8%8A%B1%E4%BA%95.com ולהציג אותה כך: http://www.花鮨.com. תג &lt;UD&gt; זה ייכלל בתוצאות החיפוש של בקשות שכללו את הפרמטר ud.

הערה: זוהי תכונת בטא.

דוגמה &lt;UD&gt;http://www.%E8%8A%B1%E4%BA%95.com/&lt;/UD&gt;
תג משנה של R
פורמט התוכן טקסט (כתובת URL בקידוד IDN)

UE
הגדרה התג &lt;UE&gt; מספק את כתובת ה-URL של תוצאת החיפוש. הערך מסומן בתו בריחה (escape) בכתובת URL כדי שהוא מתאים להעברה כפרמטר של שאילתה בכתובת URL.
דוגמה &lt;UE&gt;http://www.dominos.com/&lt;/UE&gt;
תג משנה של R
פורמט התוכן טקסט (כתובת URL שמסומנת בתו בריחה (escape))

XT
הגדרה התג &lt;XT&gt; מציין המספר הכולל המשוער של התוצאות, כפי שמצוין בתג M, מייצג למעשה את המספר המדויק סך כל התוצאות. עיין בקטע אוטומטי מידע נוסף על הסינון במסמך הזה.
דוגמה <XT />
תג משנה של רזולוציה
פורמט התוכן ריק


תוצאות XML לשאילתות של חיפוש תמונות

בבקשת התמונה לדוגמה הזו מוצגות 5 תוצאות (מספר=5) לגבי מונח החיפוש "קוף" (q=monkey).

http://www.google.com/cse?
  searchtype=image
  &num=2
  &q=monkey
  &client=google-csbe
  &output=xml_no_dtd
  &cx=00255077836266642015:u-scht7a-8i

הבקשה הזו מניבה את תוצאת ה-XML הבאה.


<GSP VER="3.2">
  <TM>0.395037</TM>
  <Q>monkeys</Q>

  <PARAM name="cx" value="011737558837375720776:mbfrjmyam1g" original_value="011737558837375720776:mbfrjmyam1g" url_<escaped_value="011737558837375720776%3Ambfrjmyam1g" js_escaped_value="011737558837375720776:mbfrjmyam1g"/>
  <PARAM name="client" value="google-csbe" original_value="google-csbe" url_escaped_value="google-csbe" js_escaped_value="google-csbe"/>
  <PARAM name="q" value="monkeys" original_value="monkeys" url_escaped_value="monkeys" js_escaped_value="monkeys"/>
  <PARAM name="num" value="2" original_value="2" url_escaped_value="2" js_escaped_value="2"/>
  <PARAM name="output" value="xml_no_dtd" original_value="xml_no_dtd" url_escaped_value="xml_no_dtd" js_escaped_value="xml_no_dtd"/>
  <PARAM name="adkw" value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" original_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" url_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A" js_escaped_value="AELymgUP4VYSok20wy9SeYczEZ5UXxpBmRsJH4oC4aXhVuZgwGKuponcNXjrYkkw2bRv1BylIm89ndJ-Q4vxvyW0tcbiqipcQC9op_cBG84T12WMvX8660A"/>
  <PARAM name="hl" value="en" original_value="en" url_escaped_value="en" js_escaped_value="en"/>
  <PARAM name="oe" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="ie" value="UTF-8" original_value="UTF-8" url_escaped_value="UTF-8" js_escaped_value="UTF-8"/>
  <PARAM name="boostcse" value="0" original_value="0" url_escaped_value="0" js_escaped_value="0"/>

  <Context>
    <title>domestigeek</title>
  </Context>

  <ARES/>
  <RES SN="1" EN="2">
    <M>2500000</M>
    <NB>
      <NU>/images?q=monkeys&num=2&hl=en&client=google-csbe&cx=011737558837375720776:mbfrjmyam1g&boostcse=0&output=xml_no_dtd
        &ie=UTF-8&oe=UTF-8&tbm=isch&ei=786oTsLiJaaFiALKrPChBg&start=2&sa=N
      </NU>
    </NB>
    <RG START="1" SIZE="2"/>
      <R N="1" MIME="image/jpeg">
        <RU>http://www.flickr.com/photos/fncll/135465558/</RU>
        <U>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/46/135465558_123402af8c.jpg
        </UE>
        <T>Computer <b>Monkeys</b> | Flickr - Photo Sharing!</T>
        <RK>0</RK>
        <BYLINEDATE>1146034800</BYLINEDATE>
        <S>Computer <b>Monkeys</b> | Flickr</S>
        <LANG>en</LANG>
        <IMG WH="500" HT="305" IID="ANd9GcQARKLwzi-t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs">
          <SZ>88386</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="130" HT="79" URL="http://t0.gstatic.com/images?q=tbn:ANd9GcQARKLwzi-
t4lpWi2AERV3kJb4ansaQzTn3MNDZR9fD_JDiktPKByKUBLs"/>
      </R>
      <R N="2" MIME="image/jpeg">
        <RU>
          http://www.flickr.com/photos/flickerbulb/187044366/
        </RU>
        <U>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </U>
        <UE>
          http://farm1.static.flickr.com/73/187044366_506a1933f4.jpg
        </UE>
        <T>
          one. ugly. <b>monkey</b>. | Flickr - Photo Sharing!
        </T>
        <RK>0</RK>
        <BYLINEDATE>1152514800</BYLINEDATE>
        <S>one. ugly. <b>monkey</b>.</S>
        <LANG>en</LANG>
        <IMG WH="400" HT="481" IID="ANd9GcQ3Qom0bYbee4fThCQVi96jMEwMU6IvVf2b8K5vERKVw-
           EF4tQQnDDKOq0"><SZ>58339</SZ>
          <IN/>
        </IMG>
        <TBN TYPE="0" WH="107" HT="129" URL="http://t1.gstatic.com/images?q=tbn:ANd9GcQ3Qom0bYbee4fThCQ
          Vi96jMEwMU6IvVf2b8K5vERKVw-EF4tQQnDDKOq0"/>
      </R>
  </RES>
</GSP>

חיפוש באמצעות תמונות: תגי XML

הטבלה הבאה מציגה תגי XML נוספים בתשובות XML לשאילתות של חיפוש תמונות.

ייתכן שסמלים מסוימים יוצגו לצד תגי משנה מסוימים ב הגדרות בהמשך. לפניכם פירוט של הסמלים והמשמעויות שלהם:

? = תג משנה אופציונלי
* = אפס מופעים או יותר של תג המשנה
+ = מופע אחד או יותר של תג המשנה

RG
הגדרה

התג &lt;RG&gt; כולל את הפרטים של תוצאת חיפוש של תמונה יחידה.

מאפיינים
שם פורמט תיאור
לא טקסט (מספר שלם) מציין את האינדקס (מבוסס 1) של בתוצאות החיפוש.
MIME טקסט ציון סוג ה-MIME של החיפוש תוצאה אחת.
תג משנה של רזולוציה
RU
הגדרה

התג <RU tag> כולל את הפרטים של כל תוצאת חיפוש של תמונה.

תג משנה של R