Martedì 30 marzo 2010
Oggi internet comprende molti contenuti. A un certo punto, potrebbe apparire online qualcosa che avreste preferito mantenere segreto (da un flame che vi siete pentiti di aver pubblicato in un blog a dati riservati che sono stati resi pubblici per sbaglio). Nella maggior parte dei casi, limitare l'accesso a questi contenuti o eliminarli è sufficiente per vederli scomparire naturalmente dai risultati di ricerca dopo qualche tempo. Tuttavia, se avete urgentemente bisogno di rimuovere dei contenuti indesiderati che sono stati indicizzati da Google e non potete aspettare che scompaiano naturalmente, potete utilizzare il nostro strumento di rimozione degli URL per sollecitare la rimozione dei contenuti dai nostri risultati di ricerca, a condizione che rispettino determinati criteri (trattati più avanti).
Abbiamo preparato per voi all'interno del blog una serie di post che spiegano come rimuovere correttamente vari tipi di contenuti e illustrano alcuni errori comuni da evitare. In questo primo post tratterò alcuni scenari di base: la rimozione di un singolo URL, la rimozione di un'intera directory o di un intero sito e la reinclusione di contenuti rimossi. Consiglio inoltre vivamente il nostro precedente post sulla gestione delle informazioni personali rese disponibili online.
Rimozione di un singolo URL
In generale, affinché le vostre richieste di rimozione abbiano esito positivo, il proprietario degli URL in questione (voi o qualcun altro) deve aver indicato che acconsente alla rimozione di questi contenuti. Per un singolo URL, ciò può essere indicato in uno dei tre modi seguenti:
- Bloccare la scansione della pagina tramite un file robots.txt.
-
Bloccare l'indicizzazione della pagina tramite un tag
meta
noindex
. - Indicare che la pagina non è più esistente restituendo un codice di stato
404
o410
.
Prima di presentare una richiesta di rimozione, è possibile verificare se l'URL è stato correttamente bloccato:
- robots.txt: potete verificare se l'URL è stato disabilitato correttamente utilizzando le funzionalità Visualizza come Googlebot o Analizza robots.txt in Strumenti per i Webmaster.
-
Tag
meta
noindex
: potete utilizzare Visualizza come Googlebot per assicurarvi che il tagmeta
venga visualizzato tra i tag<head>
e</head>
. Se volete controllare una pagina che non potete verificare in Strumenti per i Webmaster, potete aprire l'URL in un browser, andare su Visualizza > Sorgente pagina e assicurarvi di individuare il tagmeta
tra i tag<head>
e</head>
. -
Codice di stato
404
e410
: potete utilizzare Visualizza come Googlebot o strumenti come Live HTTP Headers o web-sniffer.net per verificare se l'URL restituisce effettivamente il codice corretto. A volte le pagine "eliminate" potrebbero riportare le diciture "404" o "Non trovato", restituendo però in realtà un codice di stato200
nell'intestazione della pagina; pertanto è buona norma utilizzare uno strumento di verifica delle intestazioni come controprova.
Se i contenuti indesiderati sono stati rimossi da una pagina ma questa non è stata bloccata in uno dei modi descritti sopra, non sarà possibile rimuovere completamente questo URL dai nostri risultati di ricerca. Si riscontra più spesso questo caso quando non siete i proprietari del sito che ospita i contenuti. Spieghiamo cosa fare in questo caso in un post successivo della seconda parte della nostra serie dedicata alle rimozioni.
Se un URL soddisfa uno dei criteri sopra riportati, potete rimuoverlo utilizzando lo strumento per le rimozioni, inserendo l'URL che volete rimuovere e selezionando l'opzione "Il webmaster ha già bloccato la pagina". Tenete presente che dovete inserire l'URL dove erano ospitati i contenuti, non l'URL della pagina della Ricerca Google con cui li avete trovati. Ad esempio, inserite
https://www.example.com/embarrassing-stuff.html
non
https://www.google.com/search?q=embarrassing+stuff
.
Il nostro articolo del Centro assistenza contiene ulteriori dettagli su come assicurarvi di inserire l'URL corretto. Tenete presente che se non ci indicate l'URL esatto che vi sta creando problemi, non saremo in grado di rimuovere i contenuti che intendevate segnalare.
Rimozione di un'intera directory o di un intero sito
Al fine di ottenere una rimozione a livello di directory o di sito, la directory o il sito devono essere disabilitati nel file robots.txt del sito. Ad esempio, per rimuovere la directory https://www.example.com/secret/
, il file robots.txt dovrebbe includere:
User-agent: * Disallow: /secret/
Non è sufficiente che la directory principale restituisca un codice di stato 404
, perché una directory può restituire un codice 404
ma continuare a gestire file nelle directory secondarie.
L'utilizzo di robots.txt per bloccare una directory (o un intero sito) garantisce che anche tutti gli URL sotto questa directory (o sito) siano bloccati. È possibile verificare se una directory è stata bloccata correttamente utilizzando le funzionalità Visualizza come Googlebot o Analizza robots.txt in Strumenti per i Webmaster.
Solo i proprietari verificati di un sito possono richiedere la rimozione di un intero sito o di un'intera directory in Strumenti per i Webmaster. Per richiedere la rimozione di una directory o di un sito, fate clic sul sito in questione, quindi selezionate Configurazione sito > Accesso crawler > Rimuovi URL. Se inserite la directory principale del sito come URL da rimuovere, vi verrà chiesto di confermare che volete rimuovere l'intero sito. Se inserite una directory secondaria, selezionate l'opzione "Rimuovi directory" dal menu a discesa.
Reinclusione di contenuti
Potete annullare le richieste di rimozione relative a qualsiasi sito di vostra proprietà in qualsiasi momento, comprese quelle presentate da altre persone. Per poter procedere, dovete essere proprietari verificati del sito in questione in Strumenti per i Webmaster. Dopo aver verificato la proprietà, potete selezionare Configurazione sito > Accesso crawler > Rimuovi URL > URL rimossi (o > Presentate da altri) e fare clic su "Annulla" accanto alle richieste che volete annullare.
Avete altre domande? Continuate a seguirci per leggere il resto della nostra serie di post sulla rimozione di contenuti dai risultati di ricerca di Google. Se non potete aspettare, nel nostro forum di assistenza è già stato scritto molto sulle rimozioni di URL e sulla risoluzione di problemi riguardanti casi specifici. Se avete ancora domande dopo aver letto le esperienze di altri utenti, potete chiedere nel forum. Tenete presente che, nella maggior parte dei casi, è difficile dare consigli pertinenti su una rimozione specifica senza conoscere il sito o l'URL in questione. È consigliabile condividere l'URL utilizzando un servizio di abbreviazione URL in modo che l'URL che vi preoccupa non venga indicizzato come parte del vostro post; alcuni di questi servizi consentono anche di disabilitare la scorciatoia in seguito, una volta risolta la questione.
Altri post di questa serie
- Parte II: rimozione e aggiornamento di contenuti memorizzati nella cache
- Parte III: rimozione di contenuti che non sono di vostra proprietà
- Parte IV: monitoraggio delle richieste e cosa non rimuovere
Infine, potrebbe interessarvi anche l'articolo su come gestire le informazioni disponibili per voi online.