Corrélation de Spearman
En statistique, la corrélation de Spearman ou rho de Spearman, nommée d'après Charles Spearman (1863-1945) et souvent notée par la lettre grecque (rho) ou est une mesure de dépendance statistique non paramétrique entre deux variables.
Nature | |
---|---|
Sous-classe de | |
Nommé en référence à | |
Formule |
La corrélation de Spearman est étudiée lorsque deux variables statistiques semblent corrélées sans que la relation entre les deux variables soit de type affine. Elle consiste à trouver un coefficient de corrélation, non pas entre les valeurs prises par les deux variables mais entre les rangs de ces valeurs. Elle estime à quel point la relation entre deux variables peut être décrite par une fonction monotone. S'il n'y a pas de données répétées, une corrélation de Spearman parfaite de +1 ou -1 est obtenue quand l'une des variables est une fonction monotone parfaite de l'autre.
Définition[1]
Pour un échantillon de taille n, les variables de rang sont calculées à partir des données .
La corrélation de Spearman est définie par :
Où
- est la covariance de variables de rang,
- et sont les écarts-types des variables de rang.
On constate que cette définition correspond à la corrélation de Pearson des variables de rang.
Interprétation
Le coefficient de Spearman permet de détecter des tendances monotones. Lorsque la tendance est affine, il se comporte de façon similaire au coefficient de Pearson. En revanche, il sera plus élevé que la corrélation de Pearson si la tendance est monotone mais non affine. Plus la tendance monotone est marquée, plus la valeur du coefficient est proche de 1 ou -1.
De façon similaire au coefficient de Pearson, le coefficient de Spearman aura une valeur positive lorsque la tendance est croissante et négative lorsqu'elle est décroissante.
Lorsque la tendance n'est pas monotone, il aura une valeur proche de 0.
Notes et références
- (en) « Spearman's rank correlation coefficient », dans Wikipedia, (lire en ligne)
Voir aussi
- Corrélation (statistiques)
- Un autre test de corrélation basé sur les rangs est le Tau de Kendall
- Portail des probabilités et de la statistique