Comment réussir un test utilisateurs ?

975 — Infographie vecteur créé par fullvector - fr.freepik.com

Présentation du test utilisateurs

C’est une méthode d’évaluation d’un service impliquant des utilisateurs en interaction directe avec l’interface. Cette IHM peut se réduire à un prototype dont l’état varie en fonction de l’avancement du projet. Cela déterminera le choix de la méthode de test :

Test de perception : Il permet de vérifier que les participants repèrent les fonctions attribuées aux différentes aires, boutons et commandes de l’interface. On s’assure ainsi que les composants graphiques utilisés sont compréhensibles pour les participants. Ce type de test peut être basé sur un « prototype papier » (ou offline, une présentation sur écran permettant cependant de donner un plus fidèle rendu des couleurs de l’interface que sur une feuille imprimée).

Test d’utilisabilité : Il consiste dans la réalisation d’un ensemble de tâches, plus ou moins guidées. Elles doivent être réalistes, fondées sur des usages connus ou avérés . L’observation des utilisateurs en situation permet de relever leurs difficultés, étonnements, incompréhensions et opinions à propos de l’interaction.

Évaluation comparative : Si plusieurs versions de l’application sont évaluées, le test utilisateur pourra permettre de vérifier quelle déclinaisons de l’interface s’avère la plus efficace.

Déjà utilisé en ergonomie, le test utilisateur est LA méthode pour évaluer l’utilisabilité d’une interface. Bien que ce soit une méthode fondamentalement qualitative, elle n’en demeure pas moins un outil permettant d’évaluer objectivement une dimension de l’expérience utilisateur.

Préparation du test utilisateurs

Les tests utilisateurs sont une méthode véritablement centrée utilisateurs. Leur mise en œuvre est porteuse de résultats car ils sont fiables. Ils nécessitent cependant quelques préparatifs.

Échantillonnage

Les participants doivent être de potentiels utilisateurs finaux, sans quoi le test perd de sa valeur. Enquêtes, sondages, observations de terrain ou études de marché, il faut tenter de réunir un panel le plus représentatif possible des utilisateurs-cible. La sélection du panel peut se faire sur des critères d’intention d’usage du type de produit dont il est question ou sur des variables invoquées telles que le sexe ou l’âge.

Dans la pratique on utilisera par exemple un pré questionnaire pour s’assurer des caractéristiques des participants (ex : niveau d’expertise préalable dans l’utilisation du produit). Des études ont montré que les attitudes envers les technologies ou l’informatique ont des effets sur la charge de travail mentale et les performances. Il est donc intéressant de prendre ces facteurs en considération.

Il est régulièrement avancé, dans la littérature que pour réaliser un test d’utilisabilité, cinq participants suffisent. En fait, Nielsen a montré qu’avec cinq utilisateurs bien choisis, on peut détecter 80% des problèmes d’utilisabilité. Au-delà de cinq, on ne découvre plus beaucoup de nouveaux problèmes. Cependant, si le test utilisateurs vise à comparer entre elles plusieurs interfaces dans le cadre d’un test d’hypothèses, il faudra alors autant de sujets que ce que requiert leur répartition au sein de plusieurs groupes (correspondant à différents types d’utilisateurs ou d’interfaces).

Scénario de test

L’élaboration du scénario de test et des tâches à faire accomplir aux testeurs va revêtir la plus grande importance. On peut être très directif, ce faisant, le participant utilise les fonctions que l’on veut. Cela veut-il dire que ce qu’on lui impose correspondra à l’utilisation future qu’il en fera ? Il faut s’en assurer au préalable. A l’inverse, l’exploration libre peut amener le sujet à négliger certaines fonctions par absence de buts précis… Cela renvoie à la spécification du contexte : à quelles occasions, pourquoi, et dans quels buts l’utilisateur final fera-t-il usage du service évalué ?

Prototype

Préalable à tout test utilisateur, le prototypage revêt une importance particulière. En effet, le test utilisateur prend tout son sens pendant de la conception du produit ou service. Il permet d’évaluer celui-ci au cours de sa conception, et avant même qu’il ne soit parfaitement abouti, de sorte que des modifications sont encore possibles. Ces modifications pourront également faire l’objet d’un autre test, et ce, jusqu’à ce que l’on juge le logiciel satisfaisant. Le problème de cette démarche est de pouvoir soumettre à l’utilisateur un matériel aussi proche que possible du produit fini, alors qu’il ne l’est pas encore. La difficulté réside donc dans la présentation d’un prototype testable, mais transformable aisément en cas de détection de problèmes. C’est tout l’enjeu du prototypage. De nombreux outils peuvent faciliter ce travail.

Protocole du test utilisateurs

Déroulement

“Classiquement”, le test utilisateur se déroule de la façon suivante :

Les participants sont reçus individuellement par le testeur, qui procédera à un cours entretien de façon à recueillir les renseignements biographiques utiles relatif à l’expérience d’utilisation de l’interface (le cas échéant), l’âge, l’expérience en informatique, etc. C’est au cours de cette étape que le consentement des participants devra être recueilli, notamment pour ce qui relève de l’enregistrement de la session (vidéo, audio et informations personnelles, durée de conservation). De même, la confidentialité des échanges doit leur être garantie pour leur permettre de s’exprimer librement.
Le testeur se place ensuite à côté du participant, légèrement en retrait, de façon à pouvoir assister à ses interaction avec le service évalué, comme illustré ci-dessous :

Fig. 1 : Situation de test. On voit le participant devant l’ordinateur, visage masqué, à gauche du modérateur. L’écran de télévision au premier plan est dirigé vers une salle adjacente séparée de la salle de test par une vitre sans tain. Ce dispositif permet à d’autres personnes de suivre l’activité du participant sans le perturber.

Toutefois, de nouveaux outils tels que Lookback rendent désormais possible la passation de tests à distance (testeur et participants étant physiquement éloignés), voire même, non modérés (le participant passe le test seul en suivant un ensemble d’instructions défini au préalable par le testeur). Dans ce dernier cas, le participant renseignera, le cas échéant, ses informations personnelles depuis une interface de saisie prévue à cet effet.

Après cette première étape, les participants commencent l’épreuve. Il est capital de faire savoir aux participants que ce ne sont pas eux qui sont évalués, mais l’interface. A ce titre, une erreur commise témoigne d’une erreur de conception du service, et non pas d’une erreur de leur part.

Quelle que soit la façon de procéder au test (présentiel ou à distance, modéré ou non) , le plus important est de faire en sorte de ne pas influencer les participants :

Ne pas leur suggérer de comportement ou d’action avec le service.
Ne pas leur suggérer de réponses aux questions (par exemple, on demandera “qu’en pensez-vous ?” plutôt que “vous ne trouvez pas que c’est bien ?”).

Evaluations et mesures

Perception

Ce type de test permet d’estimer, en plus de la compréhension, une certaine forme de satisfaction dans l’esthétique de l’interface. C’est d’autant plus important que les couleurs ont un rôle essentiel dans la construction de pictogrammes, icônes et autres balises de navigation qui perdraient de leur signification en leur absence. Cela permet de s’assurer d’une cohérence interne dans les menus déroulants et autres liens hypertextes de sorte que les utilisateurs trouvent intuitivement ce qu’ils cherchent là où ils le cherchent.

Objectivité & exhaustivité

Cette méthode du test utilisateurs présente l’immense avantage de l’objectivité, par opposition aux méthodes d’audit. Elle va permettre d’identifier concrètement les problèmes ergonomiques. Elle permet de mesurer l’utilisabilité en évaluant les performances des participants. Le test peut se faire aussi bien en salle de test que sur le terrain, avec les avantages et inconvénients que ces lieux d’études induisent (plus ou moins de contrôle pour plus ou moins de contexte).

Cela donne lieu à différentes façons de procéder pour collecter les informations, suivant le type de tâches, les problèmes que l’on veut détecter, et les caractéristiques du prototype à l’essai :

Certaines techniques de tests sont très directives et intrusives :
- Exploration guidée par le testeur,
- Apprentissage par co-découverte,
- etc.
D’autres moins :
- Vocalisation externe (le participant dit à voix haute tout ce qu’il fait et tout ce qui lui passe par la tête),
Certaines pas du tout :
- Observation et enregistrement à distance,
- Mesure de performances,
- Rétrospection différée (l’utilisateur commente tout ce qu’il a fait et pensé après avoir interagi avec le service).

Mesures

Parmi les données qu’il est possible de collecter, on retiendra tout d’abord l’enregistrement vidéo du visage des participants en interaction avec l’interface (elle aussi enregistrée). Ceci est désormais possible avec tous types d’appareils, desktop, laptop et smartphone. L’utilisation de logiciels comme Morae ou Lookback permettent d’intégrer en PIP (picture in picture) à la capture dynamique de l’interface le visage de l’utilisateur. Ainsi, on synchronise au sein d’un fichier l’analyse faciale des émotions à la réalisation des tâches en interaction avec l’interface.

On pensera également à l’enregistrement des mouvements oculaires, le célèbre “eye-tracker“, dont on peut s’interroger de l’utilité vis-à-vis du coût de mise en œuvre.

De façon plus pragmatique, la norme ISO 9241-11 propose d’évaluer l’utilisabilité d’une interface par différentes mesures. Elles peuvent être, par exemple :

Efficacité : qualité des résultats produits par l’interaction
•Succès / tâtonnements / échecs (mesure qualitative),
• Temps approximatif pour accomplir une tâche (mesure quantitative),
• Caractérisation des erreurs de navigation (mesure qualitative).

Efficience : mise en relation du résultat avec l’effort
• Relation entre l’efficacité et la satisfaction, la charge mentale subjective ou le temps passé.

Satisfaction : avis des utilisateurs sur l’interface
• Analyse des expressions faciales (mesure qualitative),
• Questionnaire à échelles de satisfaction (mesure quantitative).

Pour finir, après chaque type de tâche, ou à l’issue du test utilisateurs, les participants peuvent répondre à des questions permettant de faire émerger leurs représentations de l’interaction ou simplement un questionnaire de satisfaction. On peut poser plusieurs types de questions. Ils peuvent concerner différentes dimensions de l’évaluation de l’interface :

Facilité d’utilisation perçue,
Charge mentale subjective,
Une fonction ou un élément d’interaction (Qu’est-ce que vous pensez de l’accès à ce type d’information ?),
Ainsi que l’intention de l’utilisation (Utiliseriez-vous cette application si elle était disponible?).

Et après ?

Il faut itérer, c’est-à-dire prendre en considération, autant que possible, chaque problème ou difficulté identifiée, même pour un seul utilisateur, et y apporter une solution dans une prochaine version de l’interface. En effet, cette méthode étant qualitative, on ne peut pas inférer à partir de la proportion de participants touchée par un problème son incidence dans la population-cible. Chaque problème d’utilisabilité détecté doit donc être traité.