구성 파일로 프로그래밍 검색 엔진 만들기

이 페이지에서는 프로그래밍 검색 엔진 구성 파일의 기본 개념을 소개합니다.

  1. 개요
  2. 프로그래밍 검색 엔진의 기능
  3. 구성요소가 함께 작동하는 방식
  4. 검색엔진 만들기
  5. 프로그래밍 검색 엔진 파일 수정
  6. 올바른 형식 선택

개요

제어판에서 필요한 수준의 맞춤설정이 제공되지 않는다면 프로그래밍 검색 XML 형식을 사용하는 것이 좋습니다. 프로그래밍 검색 XML 형식을 사용하면 더 강력한 제어, 유연성 및 액세스를 제공할 수 있습니다.

프로그래밍 검색 엔진 구성 파일을 사용하려면 먼저 프로그래밍 검색 엔진 제어판을 사용하여 기본 검색엔진을 만들어야 합니다. 검색엔진을 만든 후에는 제어판의 개요 페이지에서 주석 및 컨텍스트 XML 파일을 다운로드할 수 있습니다.

XML 기본사항

확장성 마크업 언어(XML)는 범용 마크업 언어입니다. 읽을 수 있는 태그가 있는 텍스트입니다. 예를 들어 프로그래밍 검색 XML 형식에는 <Context> </Context><LookAndFeel> </LookAndFeel> 태그가 포함되어 있습니다.

XML 파일과 마찬가지로 프로그래밍 검색 엔진 사양은 XML 구문 (<element attribute="value">content</element>)을 따르고 올바른 형식이어야 합니다. XML에는 다음과 같은 규칙이 있습니다.

  • XML을 사용하려면 최상위 태그 앞에 XML 선언 (<?xml version="1.0"?>)을 추가해야 하지만 프로그래밍 검색 엔진 구성 파일에서는 이를 요구하지 않습니다.
  • 모든 요소에는 여는 태그 (<tag>)와 닫는 태그 (</tag>)가 있어야 합니다.
  • 모든 태그가 올바르게 중첩되어야 합니다. <sandwich><filling> peanut butter</sandwich></filling>과 같은 XML 코드는 사용할 수 없습니다. <sandwich><filling> peanut butter</filling></sandwich>와 같이 표시되어야 합니다.
  • XML은 대소문자를 구분하므로 안내에 있는 태그의 대소문자와 철자를 주의 깊게 따르세요.
  • 모든 속성 값은 큰따옴표 (<element attribute="value">)로 묶어야 합니다.
  • 모든 속성은 닫는 태그 (</element>)가 아닌 여는 태그 ( <element attribute="value">)에 정의되어야 합니다.

주석 태그 (<!-- your comment here -->)를 사용하여 직접 메모를 작성할 수 있으며, 그러면 프로그래밍 검색 엔진이 해당 텍스트 줄을 XML 코드로 파싱하지 않습니다. 알림이나 설명을 작성하는 것 외에도 주석을 사용하여 일시적으로 일부 XML 코드를 수수료를 받지 않을 수 있습니다 (특정 효과를 실험하거나 문제를 해결하려는 경우). 하지만 이러한 의견은 제어판에서 다운로드한 파일에는 유지되지 않습니다. 댓글을 보관하려면 댓글에 XML 파일의 사본을 보관해야 합니다. 댓글을 제어판에서 업로드한 후에도 마찬가지입니다.

간단한 텍스트 편집기를 사용하여 XML 파일을 만들고 편집할 수 있습니다. 텍스트 파일을 .xml 파일 확장자로 저장하기만 하면 됩니다 (예: cse_badminton.xml).

맨 위로

프로그래밍 검색 엔진의 기능

프로그래밍 검색 엔진에는 두 가지 주요 구성요소가 있으며 각 구성요소는 XML 파일로 제어됩니다.

  • 컨텍스트: 컨텍스트 XML 파일은 검색엔진의 기본 기능을 설명합니다. 이미지 검색 또는 프로모션 사용 설정 여부와 같은 검색엔진의 전체 설정을 지정합니다. 각 검색엔진에는 자체 컨텍스트 파일이 있습니다. 컨텍스트 XML 파일에 대해 자세히 알아보기 검색엔진에 가장 적합한 파일 형식을 선택하는 방법에 대한 자세한 내용은 검색엔진에 적합한 형식 선택을 참조하세요.
  • 주석: 사이트설정 XML 파일은 검색엔진에서 처리할 웹페이지 또는 웹사이트를 나열하며, 검색결과에서 사이트 순위가 지정되는 방식과 관련하여 사용자가 설정한 설정을 나타냅니다. 각 사이트와 연결된 정보를 특수효과라고 합니다. 주석 XML 파일에 대해 자세히 알아보기

이러한 파일을 처음부터 만드는 것은 권장하지 않습니다. 대신 제어판의 개요 페이지에서 다운로드하세요.

검색엔진에는 이러한 기본 구성요소 외에도 다음과 같은 보조 파일이 있을 수 있습니다.

  • 프로모션: 프로모션 XML 파일에는 사전 정의된 검색어 모음에 의해 트리거되는 일련의 맞춤 결과가 나열됩니다. 사용자가 검색어 중 하나와 정확히 일치하는 검색어를 입력하면 페이지 상단에 프로모션이 표시됩니다. 프로모션을 사용하여 사용자의 검색어에 직접 답변하거나, 중요한 정보를 안내하거나, 검색 결과 페이지의 상단에는 아직 관련성이 없는 웹페이지로 사용자를 안내할 수 있습니다. 프로모션은 제어판에서 프로모션 탭에 정의되어 있습니다. 프로모션에 대해 자세히 알아보기
  • 동의어: 동의어 XML 파일은 검색어를 확장하여 유사 검색어를 포함합니다. 예를 들어 사용자가 'simian'을 검색하면 검색엔진은 '원숭이'도 '원숭이'가 있습니다. 동의어는 제어판에서 동의어 탭에 정의되어 있습니다. 동의어에 대해 자세히 알아보기

구성요소가 함께 작동하는 방식

컨텍스트 XML 파일은 사용할 주석 파일을 지정하지 않으며 주석 XML은 컨텍스트 파일을 참조하지 않습니다. 프로그래밍 검색 엔진은 라벨을 사용하여 컨텍스트와 주석을 연결합니다. 컨텍스트 XML 파일에는 검색엔진을 식별하는 라벨이 포함되며, 주석 XML에 나열된 각 주석에는 해당 검색엔진이 속한 검색엔진을 식별하는 하나 이상의 라벨이 지정되어 있습니다.컨텍스트 파일에서 라벨 이름을 변경하면 해당 라벨로 태그가 지정된 모든 주석을 변경해야 합니다.

여러 주석 파일을 업로드할 수도 있지만 제어판을 통해 주석 파일을 다운로드하면 프로그래밍 검색 엔진이 모든 주석 파일을 하나의 주석 파일로 병합합니다. 사이트설정 파일을 사용하면 다양한 검색엔진에 맞게 동일한 사이트를 유연하게 맞춤설정할 수 있습니다. 예를 들어, 한 검색엔진은 검색을 일부 사이트로 제한하거나, 다른 검색엔진은 해당 사이트를 제거하거나, 또 다른 검색엔진은 해당 사이트를 홍보할 수 있습니다.

context.xml

다음은 컨텍스트가 적용되는 검색엔진을 식별하는 라벨이 포함된 context.xml 파일의 예입니다.

<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<BackgroundLabels>

annotations.xml

다음은 각 사이트 (주석)가 라벨과 연결되는 방식을 보여주는 주석 파일의 예입니다.

<Annotation about="code.google.com/*" score="1">
  <Label name="_include_"/>
</Annotation>

맨 위로

프로그래밍 가능한 고급 검색엔진 만들기

고급 엔진을 만들려면 다음 단계를 따르세요.

  1. 니즈에 적합한 형식을 결정합니다.
  2. 검색엔진의 사양을 정의합니다.
  3. 프로그래밍 검색 엔진에 검색할 사이트를 지정합니다.
  4. 프로그래밍 검색 엔진에 검색결과 순위를 지정하는 방법을 지정합니다.

프로그래밍 검색 엔진 파일 수정

XML 파일 작업을 하려면 제어판의 개요 페이지에서 XML 사양을 다운로드하세요. 파일을 처음부터 시작하지 않습니다. 다음 단계를 따르세요.

  1. 제어판의 개요 페이지에서 컨텍스트 파일 또는 주석 파일을 다운로드합니다. 검색 기능 섹션에서 다운로드 버튼을 클릭합니다.
  2. UNIX 스타일 줄 끝을 처리할 수 있는 텍스트 편집기를 사용합니다 (WordPad, Emacs 및 TextMate은 작동하지만 메모장은 작동하지 않음). 파일 확장자 .xml (예: cx_global.xml)로 저장하면 파일 이름을 어떻게 지정할지는 상관없습니다.
  3. 수정된 버전이 예상대로 작동하지 않아 이전 버전으로 되돌려야 하는 경우에 대비하여 다운로드한 파일의 백업 사본을 만드세요.

    사본을 만들지 않고 수정한 버전이 제대로 작동하지 않으면 파일을 디버그하거나 검색엔진을 처음부터 다시 만들어야 합니다. 재미없어요.

  4. XML 파일을 수정하고 저장합니다. 텍스트 편집기에서 파일을 다른 파일 형식이 아닌 유니코드 텍스트 문서로 저장해야 합니다.
  5. 개요 페이지의 검색 기능 섹션에서 파일을 업로드합니다.

올바른 형식 선택

프로그래밍 검색 엔진을 만들기 전에 요구사항에 가장 적합한 형식을 결정해야 합니다. 필요한 것보다 더 강력하고 복잡한 형식을 선택하지도 않으며 빠르게 성장할 수 있는 형식을 사용하고 싶지도 않습니다.

다음 표를 참고하여 적절한 형식을 선택하세요.

만들기 사용 왜냐하면 제한사항 추가 정보
사이트 수가 적은 하나 또는 몇 개의 검색엔진 관제 패널 텍스트 편집기로 파일을 만들고 업로드하는 대신 텍스트 상자를 채워 프로그래밍 검색 엔진을 빠르게 만들 수 있습니다. 제어판은 대부분의 경우 프로그래밍 검색 엔진에 익숙해지고 소수의 사이트로 구성된 검색엔진을 만들 때 유용합니다. 시작하기
많은 사이트를 사용하고 피드를 사용하는 복잡한 검색엔진 컨텍스트 파일 및 주석 파일

프로그래밍 검색 엔진 파일을 사용하면 검색엔진을 더 폭넓게 제어할 수 있으며 사이트를 정의하고 관리하는 작업이 훨씬 쉬워집니다.

컨텍스트 및 주석 파일을 사용하여 검색엔진을 만들 예정이더라도 제어판의 기능을 익혀 두는 것이 좋습니다.

검색엔진을 맞춤설정할수록 더 복잡해집니다. 프로그래밍 검색 요소와 속성을 배워야 하는데 습득하기 어렵지는 않지만 어느 정도 시간을 투자해야 합니다.

나머지 개발자 가이드도 읽어야 하지만, 안타깝게도 가장 흥미로운 읽기 자료는 아닙니다.

컨텍스트: 검색엔진 사양 정의주석: 사이트 선택

맨 위로