Corrélation de Spearman

En statistique, la corrélation de Spearman ou rho de Spearman, nommée d'après Charles Spearman (1863-1945) et souvent notée par la lettre grecque (rho) ou est une mesure de dépendance statistique non paramétrique entre deux variables.

Un coefficient de corrélation de Spearman de 1 est obtenu quand les deux variables comparées ont une relation parfaitement monotone, même si cette relation n'est pas linéaire. En revanche, la corrélation de Pearson (linéaire) n'est pas parfaite.
Corrélation de Spearman
Nature
Type of statistic (d), coefficient de corrélation (en)
Sous-classe de
Nommé en référence à
Formule

La corrélation de Spearman est étudiée lorsque deux variables statistiques semblent corrélées sans que la relation entre les deux variables soit de type affine. Elle consiste à trouver un coefficient de corrélation, non pas entre les valeurs prises par les deux variables mais entre les rangs de ces valeurs. Elle estime à quel point la relation entre deux variables peut être décrite par une fonction monotone. S'il n'y a pas de données répétées, une corrélation de Spearman parfaite de +1 ou -1 est obtenue quand l'une des variables est une fonction monotone parfaite de l'autre.

Définition[1]

Pour un échantillon de taille n, les variables de rang sont calculées à partir des données .

La corrélation de Spearman est définie par :

  • est la covariance de variables de rang,
  • et sont les écarts-types des variables de rang.

On constate que cette définition correspond à la corrélation de Pearson des variables de rang.

Interprétation

Le coefficient de Spearman permet de détecter des tendances monotones. Lorsque la tendance est affine, il se comporte de façon similaire au coefficient de Pearson. En revanche, il sera plus élevé que la corrélation de Pearson si la tendance est monotone mais non affine. Plus la tendance monotone est marquée, plus la valeur du coefficient est proche de 1 ou -1.

De façon similaire au coefficient de Pearson, le coefficient de Spearman aura une valeur positive lorsque la tendance est croissante et négative lorsqu'elle est décroissante.

Lorsque la tendance n'est pas monotone, il aura une valeur proche de 0.

Notes et références

  1. (en) « Spearman's rank correlation coefficient », dans Wikipedia, (lire en ligne)

Voir aussi

  • Portail des probabilités et de la statistique
Cet article est issu de Wikipedia. Le texte est sous licence Creative Commons - Attribution - Partage dans les Mêmes. Des conditions supplémentaires peuvent s'appliquer aux fichiers multimédias.