Gelöschte Informationen aus der Google Suche entfernen
Wenn du Dokumente und Bilder im Web veröffentlichst, werden möglicherweise unbeabsichtigt zusätzliche Informationen sichtbar, die man mit dem bloßen Auge nicht sofort erkennt. In manchen Dokumentformaten können Informationen enthalten sein, die man nicht sieht oder die der Inhaber eigentlich entfernen wollte. Diese Informationen sind aber möglicherweise für Suchmaschinen sichtbar.
Da Suchmaschinen öffentliches Material inklusive Bildern indexieren, können Inhalte, die nicht vollständig entfernt wurden, von Suchmaschinen gefunden werden. Anhand von Hilfstechnologien wie Screenreadern können diese scheinbar „verborgenen“ Inhalte leichter zugänglich gemacht werden. Auch Bilderkennungssysteme wie OCR ermöglichen die Suche nach solchen Inhalten.
Suchmaschinen finden Text und indexieren ihn auch dann, wenn dieser in einer winzigen Schriftart oder in derselben Farbe wie der Hintergrund auf der Seite platziert wird. Selbst wenn Text von einem Bild verdeckt und so für das menschliche Auge unsichtbar ist, wird er von Suchmaschinen erkannt.
Außerdem enthalten einige Dokumenttypen verschiedene Informationen, die nicht sofort auffallen. Das kann beispielsweise der Änderungsverlauf des Dokuments sein. So können Nutzer Text sehen, der bereits entfernt oder geändert wurde. Möglicherweise ist die gesamte Historie eines Bildes enthalten, das zugeschnitten oder in dem Informationen retuschiert wurden. Es können auch Metadaten in einer Datei enthalten sein, die nicht sofort sichtbar sind. Darin können die Namen der Personen aufgeführt sein, die auf die Datei zugegriffen oder sie bearbeitet haben.
Alle diese Informationen bleiben eventuell auch dann erhalten, wenn ein Dokument exportiert oder von einem Format in ein anderes konvertiert wird. Wenn du Informationen aus einer Datei entfernen möchtest, müssen sie unbedingt vollständig gelöscht werden, bevor die Datei veröffentlicht wird.
Im Folgenden findest du einige Best Practices für das Entfernen von Informationen, die nicht indexiert und nicht über die Google Suche auffindbar sein sollen.
Bilder vor dem Einbetten bearbeiten und exportieren
Die Google Suche listet Bilder auf, die im Web gefunden werden. Sie können sich auf Webseiten befinden oder auch in verschiedene Dokumentformate eingebettet worden sein. Eingebettete Bilder werden manchmal nur mit den Bearbeitungstools des entsprechenden Dokuments bearbeitet. Diese Bearbeitung wird aber beim unabhängigen Indexieren des Bildes möglicherweise nicht erkannt. Aus diesem Grund ist es ratsam, Bilder vor dem Einbetten in ein Dokument zu bearbeiten und nicht danach. Wichtig ist insbesondere:
- Entferne unerwünschte Informationen aus Bildern, bevor du sie in Dokumente einbettest. Einige Tools zur Bearbeitung von Dokumenten (z. B. Tools zur Textverarbeitung oder zum Erstellen von Präsentationen) speichern die Bilder, die du verwendest, auch in ihrer noch nicht zugeschnittenen Form. Diese sind dann eventuell auch in der veröffentlichten Version des Dokuments zugänglich. Lies daher die Dokumentation des jeweiligen Tools sorgfältig durch.
- Du solltest Text oder andere nicht öffentliche Bereiche des Bildes vollständig entfernen oder verdecken, da OCR-Systeme jeden erkannten Bildtext in durchsuchbaren Text umwandeln können.
- Entferne alle unerwünschten Metadaten.
Nachdem du die Vorschläge in diesem Dokument umgesetzt hast, exportiere oder speichere die bearbeiteten Bilder in einem Bilddateiformat ohne Vektoren und mit reduzierten Ebenen, z. B. im PNG- oder WEBP-Format. Dadurch wird verhindert, dass diese Teile der Bilder versehentlich in einem veröffentlichten Dokument vorhanden sind.
Unerwünschten Text vor dem Umwandeln des Dokuments in ein öffentliches Dateiformat bearbeiten oder entfernen
Bevor du das öffentliche Dokument generierst, entferne Text, der in der endgültigen Version der Datei nicht angezeigt werden soll. Wandle es in ein öffentliches Format um, in dem dein bisheriger Änderungsverlauf nicht gespeichert wird. Hier einige konkrete Tipps:
- Verwende geeignete Tools zum Entfernen von Informationen aus einer Datei. Beispielsweise solltest du Text nicht durch schwarze Rechtecke retuschieren. Dies kann dazu führen, dass der Text im öffentlichen Dokument erhalten bleibt.
- Prüfe die Dokumentmetadaten in der öffentlichen Datei.
- Beachte die Best Practices für das Entfernen von Informationen aus Dokumenten für das verwendete Format (PDF, Bild usw.).
- Denke auch an die Informationen in der URL oder im Dateinamen selbst. Selbst wenn das Crawling eines Bereichs einer Website durch die robots.txt-Datei blockiert wird, können die URLs in der Suche (ohne ihren Inhalt) indexiert werden. Verwende Hashes in URL-Parametern anstelle von E-Mail-Adressen oder Namen.
-
Du kannst eine Authentifizierung verwenden, um den Zugriff auf die entfernten Inhalte zu beschränken. Versieh die entsprechende Anmeldeseite mit dem robots-
meta
-Tagnoindex
, um die Indexierung zu blockieren. - Achte bei der Veröffentlichung darauf, dass deine Website in der Google Search Console verifiziert wurde. Auf diese Weise kannst du bei Bedarf schnell Inhalte entfernen.
Vorgehensweise, wenn nicht oder nicht korrekt entfernte Inhalte aus Dokumenten in der Google Suche indexiert werden
- Entferne das veröffentlichte Dokument von der Website oder aus dem Speicherort, wo du es veröffentlicht hast.
- Verwende für die verifizierte Website das Tool zum Entfernen, um die betreffenden Dokumente aus der Suche zu entfernen. Verwende ein URL-Präfix, wenn du viele Dokumente entfernen musst. Bei verifizierten Websites dauert das Entfernen einer URL in der Regel weniger als einen Tag. Dadurch wird verhindert, dass das betreffende Dokument bei Suchanfragen nach dem entfernten Inhalt erscheint.
- Hoste das Dokument, dessen Inhalte du korrekt entfernt hast, unter einer anderen URL. Dadurch wird sichergestellt, dass nur die neue Dokumentversion indexiert wird. Das erneute Crawlen und Aktualisieren bestehender URLs in einem Suchindex kann nämlich einige Zeit dauern. Aktualisiere alle Links zu diesen Dokumenten.
- Kontaktiere die Administratoren anderer Websites, die die Dokumente mit den unvollständig entfernten Inhalten ebenfalls hosten, und bitte sie, diese Dokumentversionen zu entfernen. Bitte die Administratoren, das Tool zum Entfernen in ihrem Search Console-Konto zu verwenden. Du kannst auch das Tool zum Entfernen veralteter Inhalte nutzen. So werden die Google-Systeme aufgefordert, die Suchergebnisse zu aktualisieren.
- Lass Anträge auf Entfernung von URLs ablaufen. Dies geschieht nach der Aktualisierung der URLs in unserem Suchindex oder nach etwa 6 Monaten.