Le taux de rebond n’est pas une métrique fiable !

Photo by Jaroslav Devia on Unsplash
Partager cet article

Le taux de rebond ou le graal des spécialistes du marketing

Parmi les indicateurs de performance d’un dispositif digital, il en est un que les directions marketing regardent plus que les autres notamment pour comprendre, évaluer, mesurer l’intérêt que les internautes témoignent envers les sites internet ou les applications mobiles. Une légende dirait même que plus le taux de rebond est bas plus l’intérêt des visiteurs est important.

Le taux de rebond, kesako ?

Le tx de rebond est une métrique calculée / basée  sur  le nombre de visiteurs qui ont vu une seule page sur un site (écran sur une application) et qui ont quitté le site / application juste après (fermeture d’onglet, une nouvelle requête dans la barre d’url, clic sur précédent, fermeture de l’application).

Le taux de rebond est défini comme suit :

TxR=Taux de rebond

VsP=nombre de visiteurs n’ayant vu qu’une seule page

Vs= Nombre de visiteurs du site

TxR = vsP/ Vs * 100

Quels sont les scénario qui le faussent ou le rendent inopérant ?

Le contexte du rebond

Un visiteur entrant sur une page A, puis se rendant sur une page B du même domaine ne sera pas comptabilisé en rebond.

En revanche, si il entre par la page A, puis quitte le site. Il sera comptabilisé en rebond.

L’analyse de cet indicateur permet-elle d’évaluer l’intérêt de ce visiteur ?
Roulement de tambours ……………. en fait pas du tout 😉

Cas d’usage n°1

Notre visiteur est entré sur le site, il a cliqué sur un « call to action » efficace au bout de 5 secondes, est rentré sur la page B et l’a quittée en 2 secondes car elle ne présentait pas ce qu’il attendait.

Cet utilisateur a une image neutre à négative de la marque et pour autant il n’est pas en rebond.

Cas d’usage N°2

Notre visiteur est entré sur la page A qu’il a trouvée avec l’aide d’un moteur de recherche en faisant une requête sur un des produits du moment, il est resté 15 minutes à lire le contenu d’une fiche produit, puis il a téléphoné à un de ses amis pour lui parler du produit. Enfin il a quitté le site.

Cet utilisateur a une image positive de la marque et il a recommandé le produit. Toutefois il n’a vu qu’une seule page et ainsi a été comptabilisé en rebond.

Autre exemple, une pré-home de chargement. Nous avons ici un écran qui s’affiche pour faire patienter l’utilisateur pendant un chargement et nous voulons savoir combien de personnes verront cet écran puis un second écran.

  • Le premier écran disparaît de lui même au bout de n secondes et lance l’affichage de la seconde page.
  • La seconde page peut être : la home d’un site , une landing page, la home d’une appli mobile.

Sauf problème technique (lenteur réseaux, chargement) notre taux de rebond sera de 0 % ( car les deux écrans se succéderont automatiquement). Dans ce contexte, nous mesurerons donc le bon fonctionnement de notre loader ou l’état de performance technique notre service et non l’intérêt du visiteur.

J’en vois déjà certains regarder vers le temps de consultation à la place du taux de rebond. Ce n’est pas bête, mais ce n’est pas si simple. Revenons un peu sur les bases de la collecte de données en web analytics.

Le web analytics, comment ça marche ?

Lorsqu’un utilisateur visite une page disposant d’une solution de suivi analytics correctement paramétrée, un appel vers cette solution est réalisé et des paramètres sont envoyés à la solution.

Parmi ces paramètres, on compte :

  • L’identifiant de la page,
  • la date et l’heure de la consultation.

C’est notamment avec le paramètre date et heure de la consultation que les solutions de digital analytics déterminent le temps passé sur une page.

Soit :

  • Un utilisateur qui visite 2 pages A et B
  • DH(p) : la date et l’heure de consultation d’une page
  • T(p) : le temps de consultation d’une page
  • T(A) = DH(B)-DH(A)

Ainsi, la date et l’heure de consultation de la seconde page (page B) MOINS  la date et l’heure de consultation de la première page  (page A) nous permet d’obtenir le temps passé sur la première page.

Evidement on voit rapidement les limites de ce calcul. Toutes les personnes qui ne voient qu’une page ont un temps de consultation à 0 secondes, puisque l’opération est impossible. Les outils de web analytics attribuent donc un temps de consultation de 0 secondes à toutes les visites étant en rebond, ainsi qu’à toutes les dernières pages d’une visite (absence de page suivante).

Lorsqu’on regarde les différentes métriques disponibles on s’aperçoit rapidement que les temps relatifs aux visites ou aux consultations sont présentés sous forme de MOYENNE.

Et là… c’est le drame… car les moyennes sont sensibles aux valeurs extrêmes.

Analyse de données : quels sont les éléments à observer ?

Nous tenterons ici d’exposer ces éléments dans un exemple.

Soit un site web ayant un trafic de 10 personnes, avec un taux de rebond de 40% en semaine 1

Laurent : 15 s.
Jeanne :0 s.
Martine : 20 s.
Eric : 50 s.
Catherine : 40 s.
Guillaume : 0 s.
Greg : 0 s.
Jean-Daniel: 10 s.
Marie : 0 s.
Myriam : 10 s.

Soit le même site web ayant un trafic de 10 personnes, avec un taux de rebond de 30% en semaine 2

Laurent : 5 s.
Jeanne : 3 s.
Martine : 130 s.
Eric : 9 s.
Catherine : 9 s.
Guillaume : 9 s.
Greg : 0 s.
Jean-Daniel: 0 s.
Marie : 0 s.
Myriam : 7 s.

Les indicateurs par défaut

PériodeTaux de rebondTemps de consultation moyen
Semaine 140%14,5
Semaine 230%17,2

Constatations

Si on compare les données entre les semaines 1 et 2, on constate qu’en semaine 2, le taux de rebond est meilleur, de même que le temps de consultation moyen. On pourrait donc en conclure vite que l’intérêt des utilisateurs est plus important.

Toutefois nous attirons votre attention sur le fait que les données présentées sont erronées (attribution d’un temps arbitraire pour l’exemple ci-dessus à 0 s. pour les temps non estimables). En effet pour les utilisateurs ayant des temps de consultation à 0 s., nous ne connaissons pas leur temps de consultation réel.

Il n’est donc pas très prudent de prendre en compte ce groupe pour le calcul d’une moyenne (influencée par les valeurs extrêmes), d’une médiane ou même du mode (qui recense la valeurs sur laquelle se concentre l’effectif le plus grand).

PériodeMédianeTemps de consultation moyenMode
Semaine 11014,50
Semaine 2617,20 et 9 Bi modal

Nous pouvons toutefois décider de segmenter l’audience en excluant les visiteurs en rebond et présenter des indicateurs de performance tout en indiquant  la nature de la population observée.

Observations population sans rebond

PériodeMédianeTemps de consultation moyenMode
Semaine 117.524,1610
Semaine 2924,579

Nous pourrons aussi nous attacher à évaluer la distribution de notre échantillon afin d’évaluer le poids des données erronées sur le calcul de la médiane, de la moyenne et du mode.

En semaine 1

En semaine 2

Rappel sur les statistiques

La moyenne :  quotient de la somme de plusieurs valeurs par leur nombre.

La médiane : est une valeur X qui permet de couper l’ensemble des valeurs d’une population en deux parties égales en mettant d’un coté la moitié des valeurs qui sont toutes inférieures ou égales à X et de l’autre les valeurs qui sont toutes supérieures ou égale à X.

Le mode :  est la valeur dont l’effectif est le plus important dans une population.

La distribution :  la distribution des fréquences est un tableau qui associe des classes de valeur à leurs fréquences d’apparition dans la population observée.

Les alternatives à la métrique :  taux de rebond

Comme nous avons pu le voir, l’objectif de ce type d’analyse est d’évaluer l’intérêt des visiteurs. Pour réaliser cette évaluation nous pourrons observer des indicateurs de performance (KPI) spécifiques sur les populations suivantes :

Les populations

PC : Population complète

PSR : Population sans rebond

Les indicateurs

  1. La durée moyenne de la visite sur la population sans rebond – PSR.
  2. La valeur médiane des temps de consultation des individus pour les population PC et PSR.
  3. Le mode ou la classe modale des temps de consultation des individus de notre échantillon (quel est le temps de consultation qui rassemble l’effectif le plus important sur la PSR).
  4. Enfin, la distribution de la population permettra de comprendre la répartition des individus.

Afin de rapprocher facilement ces valeurs à des utilisateurs vous devrez étendre le marquage avec des dimensions personnalisées contenant par exemple des identifiants utilisateurs.

Nous  pourrons également prévenir dans certains cas  l’inactivité de l’utilisateur en déclenchant un appel vers la solution d’analytics toutes les X secondes de façon à générer un compteur de temps sur la page visitée et de s’assurer que la visite n’est pas considérée en rebond (Adjusted bounce rate by Simo Ahava).

Quelle que soit l’approche, nous constatons qu’il n’est pas possible de traiter ces informations directement dans un outil comme Google Analytics par exemple, sans préparation (marquage spécifique) et post traitements. Les post traitements pourront être assurés et automatisés à l’aide de Google Spread Sheets. Nous détaillerons ces éléments dans les prochains mois.