Understanding measurement scales

scale
Icons made by Freepik from www.flaticon.com is licensed by CC 3.0 BY
Partager cet article

Measuring the user experience and digital performance implies to be interested in measurement scales. The choice of the graduation of the tool with which a measurement is carried out will have an impact on the way in which the data collected can be represented and processed. This is why it is necessary to carefully choose the measurement scales that will be used to characterize a digital service or its users. Indeed, not all of these scales have the same advantages and disadvantages.

Four types of scales

The notion of measurement scale is closely linked to that of variable. A variable is a quantity that can take different values (or modalities). A variable can take at least two values (minimum condition of its variation, it is then called dichotomous or binomial), but it can take several values (multinomial), or even an infinity of values (it is called continuous). There are two types of variables: qualitative and quantitative. Qualitative variables are evaluated using a label (a wordl). Quantitative variables are represented by numbers.

There are four types of measurement scales, from the simplest to the most elaborate:

  1. nominal (qualitative),
  2. ordinal (qualitative),
  3. interval (quantitative),
  4. ratio (quantitative).

 

Each measurement scale has its own characteristics, but retains the properties of the lower level scales (but the reverse is not true). However, it is possible to transform one scale into another, in one direction or the other, as we will see below.

Each measurement scale is characterized by its measure of central tendency index and its dispersion. The central tendency corresponds to the typical value of the measured variable (e. g. artihmetic mean). Conversely, the dispersion represents the variability or range of the measurement (e. g. standard deviation). We present below a simplified version of the synthesis proposed by Yvonnick Noël in his book :

 

Summary table of measurement scales (according to Yvonnick Noël)

Qualitative variables

Nominal scale

The term scale is not really appropriate for nominal scales according to David C. Howell. Indeed, they do not classify the observations. They are limited to designating them by a label (man – woman, employee – self-employed – unemployed). This label can be a name or a number (in this case, it does not contain any mathematical values, for example group 1, group 2 or group 3).

It is only possible to count the number of elements (number) in each of the categories or classes. If this number is related to the total number of observations in all categories, then we speak of frequency (which can be expressed as a percentage, for instance).

The central tendency index of the nominal scale is the mode. This is the category with the highest number of observations. It is therefore the value with the highest frequency. Thus, within a set of measures (called a distribution, in statistical jargon) there may be no mode (equal distribution of enrolment in each class), or several modes. This type of measurement scale only makes it possible to classify the object of the measurement in one category or another.

The nominal scale does not allow to calculate a dispersion index.

Ordinal scale

In addition to classifying observations into categories (such as nominal scales), ordinal scales classify these categories in relation to each other in a defined order. This is why they constitute real “scales”. They therefore assign a rank to the different categories. Likert scales, commonly used in survey responses, are very good examples of ordinal scales :

  1. Strongly agree
  2. Agree
  3. Neither one nor the other
  4. Disagree
  5. Strongly disagree

Ordinal scales do not measure the size of the gap between these ranks. We cannot therefore consider that there is the same gap between “strongly agree” and “agree” as between “neither” and “disagree”, even if these ordered categories are represented here by numbers. Only the order matters. This is why it is not possible to calculate a sum or an average on such data, because this would have no mathematical meaning.

The central tendency of an ordinal scale can be represented by the mode, but also by the median. The median is the value that divides an ordered series of observations into 2 equal parts (i.e. each containing the same number of observations).

Unlike nominal scales, ordinal scales make it possible to calculate a dispersion index, and thus to assess the variability of the distribution of results. It is called the quantile, i.e. the value that divides a set of measurements into intervals containing the same number of data. The median is therefore the quantile that separates the data set into two groups of equal size.

 

Quantitative variables

Interval scales

Interval scales are used to assess the difference between the modalities of the scale. For example, there is the same difference between the year 1935 and 1940 as between 2007 and 2012. However, this type of scale does not have a “natural” zero. Year 0 does not mean that there is no year. It is an arbitrary convention. Therefore, we cannot say that the year 2000 is twice as recent as the year 1000.

 

Ratio scale

Conversely, the ratio scales have a meaningful zero. In this case, the zero is not arbitrary and really means an absence of the measured phenomenon. This is the case for duration measurements: a time of zero seconds means that no time has passed. Thus, 40 seconds are twice as long as 20 seconds. It is these reporting scales that offer the most possibilities in terms of statistical data processing.

Interval and reporting scales can be discrete or continuous.

If the scale is discrete, the interval between two values of the scale cannot be less than one. The number of sessions using a digital service is discrete: there are no half-sessions. However, the average number of sessions can be calculated, even if the value obtained does not correspond to an integer.

If the scale is continuous, then the measurement can potentially take an infinite number of values. This is the case for elapsed time measurements. It is always theoretically possible to specify the measurement at a higher level (e.g. tenth of a second, hundredth seconds, etc.), even if the measurement tool does not allow it in practice.

For measures of variability and central tendency, quantitative scales (whether interval or ratio) allow to calculate the mean and the standard deviation. Since they retain the properties of the lower level scales, they also make it possible to determine their median and quantiles.

For the mode, it is more complicated. Indeed, if a variable can take an infinite number of values (as it is the case for continuous variables), the mode has little interest, since each measurement can be different from all the others (if the measurement tool is sufficiently accurate). In this case, it is preferable to use the notion of modal class, which corresponds to a grouping of values within intervals. Of course, the choice of the width of the interval remains arbitrary, but if we want to be able to evoke the notion of modal class (i.e. the one containing the most observations), the classes must be of an equal range.

 

Switch from one scale to another

Despite their apparent compartmentalization, it is possible to switch from one scale to another. For example, the type of terminal used to view a site is a nominal variable (smartphone, tablet or computer). However, if we consider the screen size of these devices, we can make them an ordinal variable, from the smallest to the largest. Similarly, devices could be classified according to their screen resolution, which is a ratio variable. But it is possible to do the opposite: we can choose to fragment these resolutions into arbitrarily chosen classes (e. g. from 0 to 200,000, from 200,001 to 400,000, and so on, keeping a constant interval).

These choices must be guided by a requirement for rigour and intellectual honesty in order to achieve the objectives we have set for ourselves.

Comprendre les échelles de mesure

scale
Icons made by Freepik from www.flaticon.com is licensed by CC 3.0 BY
Partager cet article

Avoir l’ambition de mesurer l’expérience utilisateur et la performance digitale implique de s’intéresser aux échelles de mesures. En effet, le choix de la graduation de l’outil avec lequel on va réaliser une mesure va avoir un impact sur la façon dont on pourra représenter et traiter les données que l’on recueille. C’est pour cela qu’il faut soigneusement choisir les échelles de mesure que l’on va utiliser pour caractériser un service digital ou ses utilisateurs, car toutes n’ont pas les mêmes avantages et inconvénients.

Quatre types d’échelles

La notion d’échelle de mesure est intimement liée à celle de variable. Une variable est une grandeur qui peut prendre différentes valeurs (ou modalités). Une variable peut prendre au minimum deux valeurs (condition minimale de sa variation, elle est alors dite dichotomique ou binomiale), mais elle peut prendre plusieurs valeurs (multinomiale), voire même une infinité de valeurs (on dit alors qu’elle est continue). On distingue deux types de variables : qualitatives et quantitatives. Les variables qualitatives sont évaluées grâce à un libellé (un mot, une étiquette). Les variables quantitatives sont quant à elles représentées par des nombres.

Il existe quatre types d’échelles de mesure, de la plus simple à la plus élaborée :

  1. nominales (qualitatives),
  2. ordinales (qualitatives),
  3. d’intervalle (quantitatives),
  4. de rapport (quantitatives).

 

Chaque échelle de mesure dispose de caractéristiques qui lui sont propres, mais conserve les propriétés des échelles de niveau inférieur (mais la réciproque n’est pas vraie). Toutefois, il est possible de transformer une échelle en une autre, dans un sens ou dans l’autre, comme nous le verrons plus bas.

Chaque échelle de mesure se caractérise par son indice de tendance centrale et sa dispersion. L’indice de tendance centrale correspond à la valeur typique de la variable mesurée (ex: la moyenne). A l’inverse, l’indice de  dispersion va représenter la variabilité ou l’étendue de la mesure (ex: l’écart-type). Nous présentons ci-dessous une version simplifiée de la synthèse proposée par Yvonnick Noël dans son ouvrage :

 

Tableau synthétique des échelles de mesure

Tableau synthétique des échelles de mesures (selon Yvonnick Noël)

Variables qualitatives

Les échelles nominales

Le terme d’échelle ne convient pas vraiment aux échelles nominales selon David C. Howell. En effet, elles ne classent pas les observations. Elles se limitent à les désigner par une étiquette (homme – femme, salarié – indépendant – sans emploi). Cette étiquette peut être un nom ou un chiffre (dans ce cas, il ne véhicule aucune grandeur mathématique, par exemple groupe 1, groupe 2 ou groupe 3).

Il est seulement possible de compter le nombre d’éléments (effectif) dans chacune des catégories ou classes. Si cet effectif est rapporté au nombre total d’observations toutes catégories confondues, on parle alors de fréquence (que l’on pourra exprimer en pourcentage, par exemple).

L’indice de tendance centrale de l’échelle nominale est le mode. C’est la catégorie sur laquelle se retrouve le plus grand nombre d’observations. C’est donc la valeur qui présente la fréquence la plus élevée. Ainsi, au sein d’un ensemble de mesures (que l’on appelle une distribution, dans le jargon statistique) il peut ne pas y avoir de mode (répartition égale de l’effectif dans chaque classe), ou bien plusieurs modes. Ce type d’échelle de mesure ne permet que de classer l’objet de la mesure dans telle ou telle catégorie.

L’échelle nominale ne permet pas de calculer d’indice de dispersion.

Les échelles ordinales

En plus de ranger les observations dans des catégories (comme les échelles nominales), les échelles ordinales classent ces catégories les unes par rapport aux autres selon un ordre défini. C’est en cela qu’elles constituent de véritables “échelles”. Elles attribuent donc un rang aux différentes catégories. Les échelles de Likert, couramment utilisées dans les réponses aux enquêtes sont de très bons exemples d’échelles ordinales :

  1. Tout à fait d’accord
  2. D’accord
  3. Ni l’un ni l’autre
  4. Pas d’accord
  5. Pas du tout d’accord

Les échelles ordinales ne permettent pas de mesurer la taille de l’écart qui existe entre ces rangs. On ne peut donc pas considérer qu’il existe le même écart entre “tout à fait d’accord” et “d’accord” qu’entre “ni l’un ni l’autre” et “pas d’accord”, même si ces catégories ordonnées sont représentées ici par des chiffres. Seul compte l’ordre. C’est pourquoi on ne peut pas réaliser sur de telles données le calcul d’une somme ou d’une moyenne, car cela n’aurait aucun sens mathématique.

On peut représenter la tendance centrale d’une échelle ordinale par le mode, mais également par la médiane. La médiane est la valeur qui partage une série d’observation ordonnée en 2 parties égales (c’est-à-dire contenant chacune le même nombre d’observations).

Contrairement aux échelles nominales, les échelles ordinales permettent de calculer un indice de dispersion, et donc d’évaluer la variabilité de la distribution des résultats. On le nomme le quantile, c’est-à-dire la valeur qui divise un ensemble de mesures en intervalles contentant le même nombre de données. La médiane est donc le quantile qui sépare le jeu de données en deux groupes de tailles égales.

 

Variables quantitatives

Les échelles d’intervalles

Les échelles d’intervalles permettent d’évaluer la différence qui existe entre les modalités de l’échelle. Par exemple, il existe la même différence entre l’année 1935 et l’année 1940, qu’entre 2007 et 2012. Par contre, ce type d’échelle ne présente pas un zéro “naturel”. L’année 0 ne signifie pas une absence d’année. C’est une convention arbitraire. Par conséquent, on ne peut pas dire que l’an 2000 est deux fois plus récent que l’an mille.

 

Les échelles de rapport

A l’inverse, les échelles de rapport disposent d’un zéro naturel. Dans ce cas, le zéro n’est pas arbitraire et signifie véritablement une absence du phénomène mesuré. C’est le cas des mesures de durée : un temps de zéro seconde signifie une absence de temps passé. Ainsi, 40 secondes sont bien le double de 20 secondes. Ce sont ces échelles de rapport qui offrent le plus de possibilités en termes de traitement statistique des données.

Les échelles d’intervalles et de rapport peuvent être discrètes ou continues.

Si l’échelle est discrète, l’intervalle entre deux valeurs de la graduation ne peut être inférieur à l’unité. Le nombre de sessions d’utilisation d’un service digital est discret : il n’existe pas de demi-sessions. Pour autant, on peut calculer le nombre moyen de sessions, même si la valeur obtenue ne correspond pas à un nombre entier.

Si l’échelle est continue, alors la mesure peut potentiellement prendre une infinité de valeurs. C’est le cas des mesures de temps passés. Il est toujours possible théoriquement de préciser la mesure à un niveau supérieur (ex: 10 ème de seconde, 100 ème de seconde, etc.), même si l’outil de mesure ne le permet pas dans la pratique.

Concernant les mesures de variabilité et de tendance centrale, les échelles quantitatives (qu’elles soient d’intervalles ou de rapport) permettent de calculer une moyenne et un écart-type. Puisqu’elles conservent les propriétés des échelles de niveaux inférieurs, elles permettent aussi d’en déterminer la médiane et les quantiles.

Pour le mode, les choses sont plus compliquées. En effet, si une variable peut prendre une infinité de valeur (comme c’est le cas pour les variables continues), le mode n’a que peu d’intérêt, puisque chaque mesure peut être différente de toutes les autres (si l’outil de mesure est suffisamment précis). Dans ce cas, on préfèrera utiliser la notion de classe modale, qui correspond à un regroupement de valeurs au sein d’intervalles. Bien évidemment, le choix de la largeur de l’intervalle reste arbitraire, mais si l’on veut pouvoir évoquer la notion de classe modale (c’est-à-dire celle qui contient le plus d’observations), il faut que les classes soient d’une étendue équivalente.

 

Passer d’une échelle à l’autre

En dépit de leur cloisonnement apparent, il est possible de passer d’une échelle à l’autre. Par exemple, le type de terminal utilisé pour consulter un site est une variable nominale (smartphone, tablette ou ordinateur). Cependant, si l’on s’attache à considérer la taille de l’écran de ces appareils, on peut en faire une variable ordinale, du plus petit au plus grand. De la même façon, on pourrait classer les appareils en fonction de la résolution de leur écran, qui est une variable de rapport. Mais il est possible de faire le chemin inverse : on peut choisir de fragmenter ces résolutions selon des classes arbitrairement choisies (ex : de 0 à 200 000, de 200 001 à 400 000, et ainsi de suite, en conservant un intervalle constant).

Ces choix doivent être guidés par une exigence de rigueur et d’honnêteté intellectuelle au service des objectifs que l’on s’est fixés.