Google Universal Analytics : Halte au spam Referrer

Google Analytics
Partager cet article

GOOGLE ANALYTICS : HALTE AU SPAM REFERRER (SEMALT, DARODAR, FREE-SHARE- BUTTONS)

AVANT PROPOS

Depuis presque 6 mois, une recrudescence de visites provenant de sites référents apparaît dans les tableaux de bord de statistiques d’audience (Acquisition puis sources de traffic / comportement puis évènements) de Google Universal Analytics.
Ces visites ont la particularité d’être concentrées sur des plages horaires très courtes et de générer très peu ou pas de pages vues. Ces visites proviennent toutes de sites référents identifiés (darodar, semalt, free-share-buttons, etc..).

ANALYSE DU SYMPTÔME (PICS DE TRAFIC DANS LES DONNÉES ANALYTICS)

Une première approche consiste à analyser les logs du serveur pour constater l’existence réelle des visites visibles dans Google Analytics. En effet, chaque appel de page génère une trace dans des logs répertoriant les accès. De fait, en identifant la date et la plage horaire critiques dans Google Analytics, nous devrions obtenir une correspondance dans ce fichier de logs (User agent, Accept language, etc..).
Il n’en est rien !
A partir de ce constat, nous pouvons affirmer qu’il s’agit de données directement injectées dans Google Universal Analytics, de fait, ces visites sont l’œuvre de robots spammeurs et non de visiteurs réels.

POURQUOI ? QUELS SONT LES OBJECTIFS, LES GAINS DES SPAMMEURS ?

Le principe est très bien décrit par le site tythewebguy.com.
– Dans un premier temps, le spammeur souscrit à un programme d’affiliation auprès d’Amazon dont le but est de percevoir une commission sur les ventes Amazon qu’il aura générées en tant qu’affilié.
– Dans un second temps, cet individu crée un site qui effectue une redirection vers les produits sur lesquels il recevra une commission.
– Dans un troisième temps, il met en place un automate qui est en charge d’injecter des données dans Google Analytics et notamment l’adresse du site qu’il a créée en étape 2.
– Enfin, vous constatez beaucoup de visites provenant toutes du même site (référent), vous êtes tentés, soit par curiosité, soit par exaspération d’aller sur ce site qui vous procure autant de visites.
Lors de votre accès au site référent, vous serez redirigé vers un site, vous serez gratifié d’un cookie par Amazon dans le but d’identifier le partenaire ayant envoyé un acheteur potentiel vers le site.
La durée de vie de ce cookie (traceur) est de 24 h. Ainsi, si vous effectuez un achat sur Amazon dans les 24h qui suivent cette visite, l’acte d’achat sera affecté à votre spammeur et il percevra une commission.

L’INJECTION DE DONNÉES DANS GOOGLE UNIVERSAL ANALYTICS

Comme expliqué, aucun visiteur ne va sur votre site dans ce contexte de spam. De fait, vous êtes en droit de vous demander comment on peut injecter des données dans Google Analytics

LE SPAM DE DONNÉES ANALYTICS, COMMENT ÇA MARCHE ?

Lorsque vous accédez à un site qui utilise Google Universal Analytics, en affichant la page demandée une requête part vers le serveur de Google UA pour indiquer qu’une personne visite une page.
Cette requête a pour destination : https://www.google-analytics.com/collect?v=1t=pageview&_s=1&dl=HTTP://www.Url-du-site-.-com&tid=UA-I-Du-site
Pour le spam d’événements, on utilisera plutôt le pixel tracking :

Google Analytics pixel-tracking-UA

Ainsi, en faisant une boucle en script avec un Curl sur cette URL, vous provoquerez autant d’événements dans Universal Analytics que votre boucle le permet.

LE SPAM DES DONNÉES ANALYTICS (GOOGLE UNIVERSAL ANALYTICS), QUE FAIRE ?

Les solutions inefficaces, non adaptées
Comme vu précédemment, ces visites ne sont pas réelles. De fait, les bloquer à l’aide d’un paramétrage serveur sera inutile.

LE BLOCAGE PAR HTACCESS / DIRECTIVES VHOST (APACHE HTTPD.CONF)

Ce paramétrage indique au serveur de refuser la connexion provenant des sites référents listés, toutefois dans le cas de hits réels (ex : attaque pour déni de service), ce mécanisme ne permettrait pas d’alléger la charge serveur car la visite serait bloquée après le traitement de cette dernière par le serveur, ici Apache.

Google Analytics
Votre serveur recevrait donc une charge conséquente pour des visites inutiles

LE PLUGIN WORDPRESS SPAMREFERRERBLOCK

Basé sur une bonne idée, ce plugin fonctionne sur la base d’une liste collaborative mise à jour régulièrement des sites des spammeurs. Ce plugin redirige les visites provenant des sites listés vers une page spécifique / page d’erreur. Toutefois dans ce contexte, ce plugin est inutile car les informations sont envoyées directement à Google Analytics à l’aide de votre UA ID sans passer par votre site.
D’autre part, le spam referrer générant des hits sur le serveur fera l’objet d’un article spécifique visant à proposer des solutions efficaces et pérennes.

STOP AUX SPAMS DANS GOOGLE UNIVERSAL ANALYTICS

Principe : la différence technique entre un robot et un visiteur réel réside dans le fait que le robot n’accepte pas de cookie. De fait, nous pouvons considérer qu’il est possible de tester que le visiteur est bien réel sur la présence d’un cookie ayant une valeur connue.
Je vous recommande de mettre cette solution en place par l’intermédiaire de Tags Manager de Google.

MISE EN PLACE AU SEIN DE GOOGLE TAGS MANAGER & GOOGLE ANALYTICS

1/ Nous allons donc créer une balise HTML et injecter le script suivant, il permettra de placer un cookie sur l’ordinateur du visiteur.

Google Analytics
Nous ajouterons à la balise une règle de déclenchement sur toutes les pages
2/ Nous allons ensuite créé une macro afin de transmettre la valeur du cookie précédemment posé à tags Manager, pour qu’ensuite GTM puisse envoyer cette variable vers Google Analytics.

Google Analytics - Google Tag manager

3/ Il faut maintenant se rendre dans Universal Analytics où nous allons déclarer une dimension personnalisée (custom dimension) avec comme valeur, le nom du cookie (valeur transmise par tags manager). Cette dimension sera attribuée à l’utilisateur.
Noter bien l’identifiant de la dimension nouvellement créée. Dans l’exemple ci dessus, il s’agit de la dimension 5. Cet Id de référence va être a reporté dans Tags Manager afin de signifier à l’outil vers quelle dimension envoyer la valeur du cookie.

Google Analytics - Google Tag manager
4/ Au sein d’Universal Analytics (toujours), nous allons créer une nouvelle vue afin de positionner un filtre et ainsi obtenir une vue avec les données brutes (donnée de référence) et une vue avec les données filtrées.

Google Analytics - Google Tag manager

Nous créons ici un filtre de vue qui inclura uniquement le trafic des visiteurs ayant comme dimension la valeur du cookie déclarée précédemment dans tags manager (Etape 1).
5/ Pour analiser la mise en œuvre, il est nécessaire de retourner dans Tags manager et d’éditer la balise Universal Analytics (Standard)

Google Analytics - Google Tag manager

En bas de cet écran, cliquer sur l’item « Dimension personnalisée » et ajouter :
– dans le champ « Index » l’identifiant de la dimension personnalisée (déclarée en étape 3 dans Google Universal Analytics).
– Dans le champ « Variable », le nom de la macro, déclarée en étape 2

Google Analytics - Google Tag manager
Ainsi dans les rapports de votre nouvelle vue, vous obtiendrez les visites réelles de vos visiteurs épurées de tous les robots spammeurs.

ANNEXES & RÉFÉRENCES

More About Darodar by tythewebguy >>>

Confirmation de lunametrics