Variable catégorielle
En statistique, une variable qualitative, une variable catégorielle, ou bien un facteur est une variable qui prend pour valeur des modalités, des catégories ou bien des niveaux, par opposition aux variables quantitatives qui mesurent sur chaque individu une quantité.
Les modalités (ou les valeurs) qu’elle prend peuvent être désignés en toutes lettre par des noms [1], comme par exemple:
- les modalités du sexe sont : Masculin et Féminin
- les modalités de la couleurs des yeux sont : Bleu, Marron, Noir et Vert ;
- les modalités de la variable mention au Bac sont : TB, B, AB et P.
Il existe deux types de variables qualitatives : les variables qualitatives ordinales et les variables qualitatives nominales. Une variable qualitative est dite ordinale, lorsque ses modalités peuvent être classées dans un certain ordre naturel permettant une comparaison comme c’est le cas de la variable Mention au Bac. Une variable qualitative est dite nominale, lorsque ses modalités ne peuvent être classées de façon naturelle comme par exemple le cas de la variable Couleur des Yeux.
Une confusion habituelle entre les deux types de variables peut venir de l'encodage des variables qualitatives qui peut être parfois numérique comme les numéros de téléphone ou bien les codes postaux.
Un critère trivial de distinction avec les variables quantitatives est le calcul de la moyenne : même encodée numériquement, la moyenne d'une variable qualitative n'a pas de sens (par exemple, la moyenne de numéros de téléphone).
Notes et références
- Fabrice Mazerolle, Statistique Descriptive (lire en ligne)