+ 33 6 81 51 67 47 contact@digitaleez.fr

Comment se débarrasser des Spams dans Google Analytics en 3 étapes ?

Comme tout bon e-commerçant, j’ai pris pour habitude de consulter mes analytics tous les jours, notamment sur l’application de Google Analytics que je trouve très bien faite. Pour ma jeune société, chaque connexion compte, je ressens toujours le même frisson quand je vois que mon trafic augmente.
Cela dit, voir doubler son trafic du jour au lendemain sans rien faire, c’est bizarre, et je ne crois pas trop à la magie. Par contre, il est de notoriété publique que des robots peuvent augmenter artificiellement les statistiques et ainsi fausser les décisions à prendre.

Comprendre l’origine du trafic

Voyageur dans l’âme, je commence toujours par regarder la provenance géographique de mes visiteurs. Depuis quelques jours, je ne peux pas m’empêcher de constater une hausse de popularité en …. Russie.

google-analytics-carte-monde

Mon site n’est disponible qu’en français et mes relations avec la Russie sont très limitées … Je trouve ça louche ! Sans grand effort, je découvre que mon trafic a subit une attaque de robots !

google-analytics-langue

Le responsable le voilà : http://motherboard.vice.com/read/this-pro-trump-russian-is-spamming-google-analytics

google-analytics-robot-vote-for-trump


Des robots sur Google Analytics, toujours plus intelligents

S’il est vrai que « Les referral Spams se situent logiquement dans le rapport dédié aux sites référents », il faut savoir désormais que les spam évoluent. Il n’est plus seulement question de repérer un Spam via la liste des sites référents comptabilisant 0 minute de temps passé sur votre site et un taux de rebond de 100%.

Ces nouveaux robots sont plus intelligents et se confondent dans le trafic de vos internautes. Ils consultent plusieurs pages, y passent du temps et n’impactent plus simplement les sources d’acquisition mais aussi d’autres paramètres comme les langues ou encore vos propres Urls.

Regardez plutôt :

google-analytics-tableau-robot-trump

Ce spam ne ressemble donc pas aux classiques, simplement filtrés dans referal spams, il remonte dans une langue inconnue et affiche un taux de rebond extrêmement faible (les robots envoyés ayant consultés plusieurs pages et étant restés plus de 2 minutes sur mon site).

Je diffère mes velléités de lancement commercial en Russie, car la priorité est à la sécurisation. Je rappelle donc ci-après les étapes à suivre pour éliminer le trafic malveillant.

Eliminer le trafic malveillant en 3 étapes

A.           Protégez vos données sur Google Analytics.

Ce n’est pas une étape qui permet d’exclure le trafic malveillant mais elle est primordiale pour la protection des données.

google-analytics-vues-back-up

Il faut avoir trois vues minimum, c’est une règle de base.

  1. Vue Back up : Vue sans filtre qui sert de sauvegarde.
  2. Vue Analyse: la vue d’analyse qui de par son paramétrage doit se rapprocher le plus possible du comportement de vos internautes !
  3. Vue Recette (ou test) : Elle vous sert d’environnement de pré-production Analytics. Testez vos mises en place et leurs effets sur votre donnée avant de les appliquer à votre vue d’analyse. Vos données vous disent MERCI.

A.           Filtrer les robots sur Google Analytics

Une question nous est souvent posée : « Mais Google ne fait rien contre ces attaques ? ». Les attaques de robots se multiplient et rivalisent de techniques pour polluer le trafic des utilisateurs Google Analytics. Google doit d’abord les identifier pour ensuite les contrer.

Un moyen simple d’avoir une partie des robots bloqués est de cocher la case « Exclure tous les appels de robots connus » dans le champ filtrage des robots (propriété de la vue).

 

google-analytics-filtrer-robots

Cela élimine une partie des spam déjà identifiés, mais la preuve, tous ne sont pas exclus… dans la vue brute sur laquelle j’ai identifié cette hausse de trafic, cette option était bien cochée, mais le spam est bel et bien passé. Heureusement, dans la vue Analyse, celle qui vise à comprendre le comportement du trafic réellement humain, d’autres filtres avaient été appliqués.

A.           Exclure de son trafic les SPAMs avec les filtres !!!

Avant d’aller plus loin : Attention aux filtres ! Le filtre est une règle que vous demandez à Google d’appliquer sur l’ensemble de vos données. Si les données n’entrent pas dans le cadre de la règle fixée par le filtre alors LES DONNEES NE SONT PAS COLLECTEES. Il est alors impossible de les récupérer. D’où l’importance des trois vues !

Comment créer un filtre ? Cela se passe au niveau de la vue !

 

 

Le filtre « Nom d’hôte »

Le premier filtre à créer sur votre vue d’analyse, pour vous prémunir du trafic malveillant est celui dit du Nom d’hôte.

google-analytics-nom-hote-valide

 

Le but de ce filtre est d’inclure dans votre trafic les domaines / sous domaines que vous souhaitez étudier (e.g : exemple.com et blog.exemple.com).

Pour ce faire, créez un filtre (donnez-lui le nom « Nom d’hôtes valides » par exemple) avec le « type de filtre » personnalisé et sélectionnez « inclure » puis comme champ de filtrage « Nom d’hôte ».

Pour ce qui est de la règle de filtrage, je recommande l’utilisation d’une expression régulière afin de ne pas créer un filtre par domaine.

 

Faites attention ! Les expressions régulières laissent peu de place à l’erreur alors renseignez-vous et testez la. Pour ma part, j’utilise le site suivant : https://regex101.com/ .

Enfin, n’oubliez pas qu’en cas d‘ajout d’un nouveau domaine, celui-ci ne remontera de données que si vous l’ajoutez dans ce filtre.


Le filtre « Exclusion des spams »

google-analytics-filtre-exclusion-spams.jpg

Le filtre « Nom d’hôte » que nous avons au-dessus vous aide à exclure une partie des robots mais pas tous. Ce filtre supplémentaire demande une routine et une surveillance des spams dans vos sources de trafic.

Il s’agit ici de repérer les robots qui vous envoient de fausses sessions et gonflent votre trafic.

Le but de ce filtre est d’empêcher tous les spams identifiés de revenir vous embêter.

Les expressions régulières permettent d’en exclure plusieurs par filtre (limité à 255 caractères) et vous évitent de créer un filtre par spam identifié : Vous allez me dire, j’ai 100 filtres à disposition, je suis large… Méfiez-vous cela arrive vite !

Ci-dessous un exemple, des choses à ne PAS faire :

google-analytics-ajouter-filtre

Chez Digitaleez.fr, nous tenons à jour une base de plus de 600 sources de spam identifiées (qui nous sert à mettre à jour chaque semaine les bases sur les comptes de nos clients)

On reprend la création d’un nouveau filtre : cette fois au lieu d’inclure, nous allons sélectionner « exclure », et dans le champ de filtrage renseignez « source de la campagne ». Il ne vous reste plus cas insérer la petite expression régulière que vous avez concoctée et testée dans la « Règle de filtrage ».

Tester et observer

Avant de mettre en œuvre ces filtres, TESTEZ et OBSERVEZ vos filtres sur votre vue test pour connaitre leur impact.

Au fur et à mesure, ajoutez les nouveaux spams identifiés à votre expression régulière (on le dit et on le redit TESTEZ-les, même lors de modifications ! Croyez-moi une erreur est vite arrivée !).

Pour les plus tenaces d’entre vous lorsque vous arriverez aux 255 caractères réglementaire, il vous suffit d’éditer un nouveau filtre par exemple : «  Exclusion spams 2 »

Voici une méthode pour vous aménager une vue excluant le trafic malveillant pour conduire vos analyses sur des données qui représentent vraiment le comportement de vos utilisateurs.

Bonnes analyses à tous !!

Cyrille

NB : Si le trafic provoqué par les robots est trop important et que vous avez besoin de votre historique pour faire des analyses, n’oubliez pas qu’il est possible de créer des « segments personnalisés ». Ce sera le sujet d’un autre article.

Si vous avez des difficultés à protéger votre trafic, ou si vous avez simplement une question alors n’hésitez pas à nous contacter.