컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
Google 검색에서 수정된 정보 제외하기
웹에 문서와 이미지를 게시할 때 사람의 눈으로는 즉시 발견할 수 없는 정보를 의도치 않게 게시할 수 있습니다. 특히 보이지 않거나 수정하려던 정보가 일부 문서 형식에 포함되어 검색엔진에 표시될 수 있습니다.
검색엔진은 이미지를 포함하여 웹에 공개된 자료의 색인을 생성하므로 완전히 수정되지 않은 콘텐츠가 검색엔진에서 검색될 수 있습니다. 스크린 리더와 같은 보조 기술을 사용하면 이렇게 '숨겨진' 것으로 보이는 콘텐츠에 더 쉽게 액세스할 수 있으며, 마찬가지로 광학식 문자 판독(OCR)과 같은 일반적인 이미지 인식 기법을 사용하여 이러한 콘텐츠를 검색할 수도 있습니다.
텍스트를 아주 작은 글꼴로 입력하거나, 글꼴 색상을 배경 색상과 동일하게 설정하거나, 텍스트를 이미지로 가리면 사람의 눈으로는 볼 수 없지만, 이렇게 한다고 실제로 자료가 수정되는 것은 아니므로 검색엔진에서 자료의 색인을 생성하여 검색 가능하게 만들 수 있습니다.
마찬가지로 일부 문서 유형에는 눈으로 즉시 확인할 수 없는 다양한 방식으로 정보가 포함되어 있기도 합니다. 문서 변경 내역이 포함되어 수정되거나 변경된 텍스트를 사용자가 볼 수 있는 경우도 있으며 잘리거나 수정된 정보가 포함된 이미지의 전체 버전이 유지될 수도 있습니다. 또한 파일에 눈으로 즉시 확인할 수 없는 메타데이터가 포함되어 파일에 액세스하거나 파일을 수정한 사용자의 이름이 나열되어 있을 때도 있습니다.
이 모든 정보는 문서를 내보내거나 한 형식에서 다른 형식으로 변환하는 경우에도 그대로 유지됩니다. 파일에서 정보를 삭제해야 한다면 파일을 공개하기 전에 파일에서 정보를 완전히 삭제하는 것이 중요합니다.
다음은 Google 검색을 통해 색인이 생성되고 검색이 가능해지는 것을 원치 않는 문서에서 정보를 적절하게 수정하는 방법에 관한 권장사항입니다.
이미지를 삽입하기 전에 수정하고 내보내기
Google 검색은 웹에서 찾은 이미지를 나열합니다. 여기에는 웹페이지에 있거나 다양한 문서 형식에 삽입된 이미지가 포함됩니다. 삽입된 이미지는 포함된 문서의 수정 도구만 사용하여 수정되는 경우가 있습니다. 이로 인해 문서와는 별개로 이미지의 색인이 생성되면 수정에 실패할 수 있습니다. 따라서 문서에 삽입한 후가 아닌 삽입하기 전에 이미지를 수정하는 것이 가장 좋습니다. 구체적인 방법은 다음과 같습니다.
- 문서에 삽입하기 전에 이미지에서 원치 않는 정보를 자릅니다. 일부 문서 수정 도구(예: 워드 프로세서 또는 슬라이드 제작 도구)는 공개 버전의 문서에 사용하는 잘리지 않은 이미지를 유지하므로 도구의 문서를 꼼꼼히 검토해야 합니다.
-
OCR 시스템이 표시된 이미지 텍스트를 검색 가능한 텍스트로 바꿀 수 있기 때문에 이미지에 있는 모든 텍스트 또는 기타 비공개 부분을 완전히 삭제하거나 가립니다.
-
원치 않는 메타데이터를 모두 삭제합니다.
이 문서의 추천사항을 따른 후 벡터가 아닌 이미지 파일 형식이나 병합된 이미지 파일 형식(예: PNG 또는 WEBP)으로 업데이트된 이미지를 내보내거나 저장합니다. 이렇게 하면 이미지의 해당 부분이 부주의로 공개 문서에 포함되는 것을 방지할 수 있습니다.
공개 파일 형식으로 변경하기 전에 원치 않는 텍스트 수정 또는 삭제하기
공개 문서를 만들기 전에 파일의 최종 버전에 표시하지 않으려는 텍스트를 모두 삭제합니다. 이전 변경 내역을 유지하지 않는 공개 형식으로 변경합니다. 다음은 더 구체적인 도움말입니다.
- 파일의 정보를 수정해야 한다면 적절한 문서 수정 도구를 사용합니다. 예를 들어 수정 방법으로 텍스트 위에 검은색 직사각형을 배치하지 마세요. 이렇게 하면 텍스트가 공개 문서에 계속 포함될 수 있습니다.
-
공개 파일에서 문서 메타데이터를 다시 확인합니다.
-
사용하는 형식(PDF, 이미지 등)의 문서 수정 권장사항을 따릅니다.
-
URL 또는 파일 이름 자체에 담긴 정보를 고려합니다. 웹사이트의 일부가 robots.txt로 인해 차단된 경우에도 콘텐츠 없이 검색에서 URL의 색인이 생성될 수 있습니다. URL 매개변수에 이메일 주소나 이름 대신 해시를 사용합니다.
-
수정된 콘텐츠에 대한 액세스 제한을 위해 인증 사용을 고려해 보세요.
noindex
robots meta
태그로 결과 로그인 페이지를 게재하여 색인 생성을 차단합니다.
-
게시할 때는 웹사이트가 Google Search Console에서 확인되어야 합니다.
이렇게 하면 필요한 경우 빠르게 삭제할 수 있습니다.
수정되지 않았거나 잘못 수정된 문서가 Google 검색에서 색인 생성된 경우 어떻게 해야 하나요?
-
게시한 웹사이트나 위치에서 게시된 문서를 삭제합니다.
-
확인된 사이트의 삭제 도구를 사용하여 문제의 문서를 Google 검색에서 삭제합니다. 여러 문서를 삭제해야 한다면 URL 접두어를 사용하세요. 확인된 사이트의 경우 URL 삭제에는 일반적으로 하루가 걸리지 않습니다. 이렇게 하면 수정된 콘텐츠 검색에는 문제의 문서가 표시되지 않습니다.
-
올바르게 수정된 문서를 다른 URL 아래에 호스팅합니다. 이렇게 하면 새로 색인 생성된 버전이 새 문서이고 이전 버전의 문서가 아니게 됩니다. URL을 다시 크롤링하고 검색 색인에서 업데이트하는 데는 시간이 걸릴 수 있기 때문입니다. 이러한 문서로 연결되는 링크를 업데이트합니다.
-
잘못 수정된 문서를 호스팅 중일 수 있는 다른 사이트에도 문의하여 게시 중단을 요청합니다. Search Console 계정에서 삭제 도구를 사용하라고 요청하거나 오래된 콘텐츠 삭제 도구를 사용하여 Google 시스템에 검색결과를 업데이트해 달라고 요청하면 됩니다.
- URL 삭제 요청이 만료되게 합니다. 삭제 요청은 URL이 Google 검색 색인에서 업데이트되거나 약 6개월이 지나면 만료됩니다.
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2025-08-04(UTC)
[null,null,["최종 업데이트: 2025-08-04(UTC)"],[[["\u003cp\u003eAvoid unintentionally publishing sensitive information hidden within documents or images, as search engines can index this data.\u003c/p\u003e\n"],["\u003cp\u003eEmploy proper redaction techniques like cropping, obscuring, or removing sensitive content before publishing files, rather than relying on visual concealment methods.\u003c/p\u003e\n"],["\u003cp\u003eEdit images and remove unwanted text before embedding them into documents to prevent unintended exposure of redacted content.\u003c/p\u003e\n"],["\u003cp\u003eUse the Google Search Console's removal tools if improperly redacted documents are indexed to quickly remove them from search results.\u003c/p\u003e\n"]]],["To keep information out of Google Search, properly redact documents before publishing. Edit images before embedding them, cropping unwanted parts, removing text, and deleting metadata. Remove unwanted text from documents, using redaction tools instead of merely covering text. Export images in non-vector formats. For indexed, improperly redacted content, remove the live document, use Google Search Console's Removals tool, host a properly redacted version under a new URL, and contact other hosts to remove the documents.\n"],null,["# Keep Redacted Information out of Google | Google Search Central\n\nKeep redacted information out of Google Search\n==============================================\n\n\nWhen publishing documents and images on the web, you may unintentionally publish information\nbeyond what is immediately visible to the human eye. In particular, information that you might\nnot see, or that was intended to be redacted, might be included in some document formats and\nvisible to search engines.\n\nBecause search engines index public material on the web, including images, content that is\nnot completely redacted can potentially be findable in search engines. Assistive technologies\nlike screen readers can make this seemingly \"hidden\" content more easily accessible, and\ncommon image understanding techniques like optical character recognition (OCR) similarly make\nit possible to search for this content.\n\nEven though putting text in a tiny font, using a font color that's the same as the background\nthe text is on, or covering text with an image may make something invisible to the human eye,\nthese methods don't actually redact material in a way that prevents search engines from\nindexing it and making it findable.\n\n\nSimilarly, some document types include information in various ways that aren't immediately\nvisible. They might include the document's change history, allowing users to see text that has\nbeen redacted or altered. They might retain the full versions of images that contain cropped\nor redacted information. There might also be metadata that's included in a file, which is not\nimmediately visible, that may list the names of people who accessed or edited the file.\n\n\nAll of this information can remain even when a document is exported or converted from one\nformat to another. If you need to remove information from a file, it's critical that the\ninformation is removed completely from the file before that file is made public.\n\n\nHere are some best practices for how to appropriately redact information from documents that\nyou don't want to be indexed and made discoverable via Google Search.\n\nEdit and export images before embedding them\n--------------------------------------------\n\n\nGoogle Search lists images that it finds across the web, both those that are on web pages or\nthose that are embedded into various document formats. Embedded images are sometimes edited\nusing only the containing document's editing tools. This can cause this redaction to fail when\nan image is indexed apart from the document. That is why it's best to edit images before\nembedding them into a document, not after. In particular:\n\n- Crop out unwanted information from images before embedding them into documents. Some document editing tools (such as word processors or slide creation tools) will maintain any uncropped images that you use in the public version of the document, so be sure to review the tool's documentation thoroughly.\n- Completely remove or obscure any text or other non-public parts of the image, as OCR systems may turn any image text seen into searchable text.\n- Remove any undesired metadata.\n\n\nAfter following the suggestions in this document, export or save the updated images as non-vector or\nflattened image file formats such as PNG or WEBP. This prevents those parts of the images from\nbeing inadvertently included in a public document.\n\nEdit or remove unwanted text before moving to a public file format\n------------------------------------------------------------------\n\n\nBefore you generate the public document, remove any text that you don't want displayed in the\nfinal version of the file. Move to a public format that does not keep your previous change\nhistory. Here are more specific tips:\n\n- Use proper document redacting tools if a file needs to have information redacted. For example, avoid placing black rectangles over text as a redaction method, as this can result in the text still being included in the public document.\n- Double-check the document metadata in the public file.\n- Follow the [document redaction best practices](https://www.google.com/search?q=document+redaction+best+practices) for the format that you are using (PDF, image, etc).\n- Consider information in the URL or file name itself. Even if a part of a website is [blocked by robots.txt](/search/docs/crawling-indexing/robots/intro), the URLs may be indexed in search (without their content). Use hashes in URL parameters instead of email addresses or names.\n- Consider using authentication to limit access to the redacted content. Serve the resulting login page with a [`noindex` robots `meta` tag](/search/docs/crawling-indexing/block-indexing) to block indexing.\n- When publishing, make sure that the website is [verified in Google Search Console](https://support.google.com/webmasters/answer/9008080). This allows quick removal action, if needed.\n\nWhat to do if unredacted or improperly redacted documents are indexed in Search\n-------------------------------------------------------------------------------\n\n1. Remove the live document from the website or location where you published it.\n2. Use the [Removals tool](https://support.google.com/webmasters/answer/9689846) for the verified site to remove the documents in question from Search. Use a URL prefix if you need to remove many documents. For verified sites, a URL removal generally takes less than a day. This prevents the document in question from appearing for any searches for redacted content.\n3. Host the properly redacted document under a different URL. This makes sure that any newly indexed version is of the new document, and not an older version of the document (since recrawling of URLs and updating them in a search index can take a bit of time). Update any links to those documents.\n4. Contact any other site that may also be hosting the improperly redacted documents and ask them to take them down as well. Ask them to use the Removals tool in their Search Console account, or you can use the [Outdated Content tool](https://support.google.com/webmasters/answer/7041154) to ask Google's systems to update the search results.\n5. Allow the URL removal requests to expire (this happens after the URLs were either updated in the Google Search index, or after about 6 months)."]]