#NoHacked : Identifier un cas particulier de hacking (partie 1) : l'injection de pages de contenu auto-généré

lundi 17 août 2015

Aujourd'hui, dans le cadre de notre campagne #nohacked, nous allons vous expliquer comment identifier et diagnostiquer un type de hacking (piratage) que nous observons de plus en plus. Même si votre site n'est pas infecté par ce type de piratage, bon nombre des conseils donnés ici peuvent être utiles pour d'autres types de piratage. La semaine prochaine, nous publierons un article sur la façon de remédier à ce piratage.

Poursuivez les discussions sur Twitter et Google+ en utilisant le hashtag #nohacked. ( Partie 1 , Partie 2 , Partie 3 )



Identification des symptômes

1. Pages au contenu auto-généré

Le type de piratage dont nous parlons aujourd'hui se caractérise par la présence de pages contenant du spam qui semblent avoir été injectées sur le site par un hacker. Ces pages contiennent des images, des liens, et du texte vides de sens, mais sont souvent riches en mots clés, dans le but de manipuler les moteurs de recherche. Par exemple, le piratage crée des pages telles que www.example.com/pf/télécharger-2015-gratuit-crack-complet.html qui contiennent un contenu auto-généré qui peut ressembler à cela :

2. Techniques de dissimulation (cloaking)

L'injection de pages utilise souvent des techniques de dissimulation (cloaking) pour éviter que les webmasters ne le détectent. Le cloaking consiste à présenter des URL ou des contenus différents aux webmasters, aux visiteurs, et aux moteurs de recherche. Par exemple, le webmaster du site peut voir une page vide ou une page HTTP 404, qui lui donnerait à penser que le piratage n'est pas ou plus présent. Cependant, les internautes qui visitent la page depuis les résultats de recherche continuent à être redirigés vers des pages contenant du spam, et les moteurs de recherche qui explorent le site voient toujours du contenu auto-généré.


Détection d'un piratage

Une surveillance appropriée du piratage sur votre site est donc essentielle: elle vous permet de remédier aux problèmes plus rapidement et de minimiser les dommages potentiels. L'injection de pages piratées peut être détectée de diverses manières:

Recherche d'un pic dans le trafic du site Web

Puisque ce piratage crée un grand nombre d'URL riches en mots clés qui sont explorées par les moteurs de recherche, vérifiez qu'il n'y a pas eu un pic récent et inattendu du trafic. Si vous en remarquez un, utilisez l'outil Analyse de la recherche de la Search Console pour déterminer si des pages piratées sont ou non à l'origine de ce trafic inhabituel sur votre site Web.

Suivi de l'apparence de votre site dans les résultats de recherche

Nous conseillons à tous les webmasters de vérifier régulièrement l'apparence de leur site dans les résultats de recherche. En plus de détecter d'autres types de problèmes, cela permet également de détecter les symptômes d'un piratage. Vous pouvez vérifier votre site sur Google en utilisant l'opérateur site: sur votre domaine. Recherchez ainsi site:example.com. Si vous voyez un lien avec du contenu auto-généré associé à votre site ou un libellé qui indique "Ce site peut être piraté.", il est possible que votre site soit infecté.

Inscription à Google Alertes

Nous vous recommandons de vous inscrire à la Search Console . Dans la Search Console, vous pouvez vérifier si nous avons détecté des pages piratées sur votre site en consultant l'outil d'affichage des actions manuelles ou le rapport Problèmes de sécurité . La Search Console vous envoie également un message si nous découvrons des pages piratées sur votre site.

De plus, nous vous recommandons de mettre en place des alertes Google pour votre site. Google Alertes vous envoie un e-mail si nous découvrons de nouveaux résultats pour une requête de recherche. Par exemple, vous pouvez configurer une alerte pour votre site avec des termes de spam fréquents , tels que [site:example.com logiciel pas cher]. Si vous recevez un e-mail qui indique que nous affichons une nouvelle requête pour ce terme, vous devez immédiatement vérifier les pages de votre site qui ont déclenché cette alerte.


Diagnostic de votre site

Les outils utiles

Dans la Search Console, vous avez accès à l'outil Explorer comme Google . Cet outil vous permet de voir une page comme GoogleBot la voit. Cela vous aidera à identifier les pages piratées à l'aide de techniques de dissimulation (cloaking). D'autres outils de fournisseurs tiers, payants ou gratuits, sont répertoriés dans l'annexe de cet article.

Recherche de pages piratées

Si vous avez un doute sur la présence de contenu piraté sur votre site, l'outil de dépannage pour les sites piratés peut vous guider pour réaliser quelques vérifications fondamentales. Pour le type de piratage par injection de pages, vous devrez effectuer une recherche site: sur votre site. Recherchez les pages suspectes et les URL avec des mots clés étranges dans les résultats de recherche. Si votre site contient un grand nombre de pages, vous devrez peut-être tenter une requête plus ciblée. Identifiez des termes de spam fréquents et ajoutez-les à votre requête de recherche site: en écrivant par exemple [site:example.com logiciel pas cher]. Essayez d'utiliser différents termes de spam pour voir si des résultats s'affichent.

Recherche de techniques de dissimulation (cloaking) sur des pages piratées

Puisque ce type de piratage utilise des techniques de dissimulation (cloaking) pour empêcher une détection précise, il est très important d'utiliser l'outil Explorer comme Google de la Search Console pour vérifier les pages contenant du spam que vous avez trouvées lors de l'étape précédente. N'oubliez pas que les pages dissimulées peuvent vous présenter une page HTTP 404 qui vous amène à penser que le problème est résolu même si la page reste en ligne. Vous devez également utiliser l'outil Explorer comme Google sur votre page d'accueil. Ce type de piratage ajoute souvent du texte ou des liens sur la page d'accueil.






Nous espérons que cet article vous a permis de mieux comprendre comment identifier et diagnostiquer les piratages qui injectent des URL au contenu auto-généré sur votre site. La semaine prochaine, nous vous expliquerons comment supprimer ce piratage de votre site.  Suivez nos campagnes sur les réseaux sociaux, et partagez vos astuces et vos idées pour utiliser le Web en toute sécurité avec le hashtag #nohacked.


Si vous avez d'autres questions, posez-les sur nos forums d'aide pour les webmasters . Une communauté de webmasters vous aidera à y répondre.

Publié par : Eric Kuan, Webmaster Relations Specialist et Yuan Niu, Spam Analyst



Annexe

Voici des outils qui analysent votre site pour détecter les contenus problématiques. Hormis VirusTotal, Google n'a aucun lien avec ces outils.


VirusTotal , Aw-snap.info , Sucuri Site Check , Wepawet : ces outils peuvent analyser votre site afin de détecter des contenus problématiques. N'oubliez pas que ces scans n'identifieront pas forcément tous les types de contenus problématiques.