wikiHow est un wiki, ce qui veut dire que de nombreux articles sont rédigés par plusieurs auteurs(es). Pour créer cet article, 51 personnes, certaines anonymes, ont participé à son édition et à son amélioration au fil du temps.
Cet article a été consulté 27 800 fois.
Le coefficient de corrélation de Spearman permet d'analyser les relations non linéaires monotones (si une des variables augmente, l'autre fait de même, et inversement). Pour calculer le coefficient de Spearman, vous devez classer vos deux séries de données, calculer les différences de rangs au carré afin de trouver la somme de ces différences (Σd2). Cette valeur est ensuite entrée dans la formule de calcul (standard ou simplifiée) du coefficient de corrélation de Spearman. Ce coefficient peut être établi sous Excel ou avec des commandes du langage R.
Étapes
Méthode 1
Méthode 1 sur 3:Calculer le coefficient de Spearman à la main
-
1Tracez un tableau de données. Ce tableau sera très pratique pour rentrer vos données et inscrire vos calculs. Vous devez faire un tableau avec :
- 6 colonnes (données 1, données 2, rang 1, rang 2, d et d2),
- autant de lignes que vous avez de paires de données.
-
2Remplissez les deux premières colonnes. Inscrivez vos données.
-
3Dans la troisième colonne, classez vos données. Classez-y la première colonne de 1 à n, cette valeur étant le nombre de données que vous avez. Attribuez le rang 1 à la plus faible valeur, le rang 2 à la plus faible valeur suivante…
-
4Dans la quatrième colonne, classez les autres données. Classez-y les valeurs de la deuxième colonne comme cela a été fait pour la troisième colonne.
-
Si dans vos colonnes, vous avez deux données (ou plus) égales, faites la moyenne des rangs des données en question. Modifiez ensuite les premiers rangs obtenus par cette moyenne.
Dans l'exemple ci-contre, vous voyez qu'il y a deux 5, classés au rang 2 et 3. Faites la moyenne de ces deux rangs : ici, ce sera 2,5. Remplacez les premiers rangs (2 et 3) par la moyenne, soit 2,5.
-
Si dans vos colonnes, vous avez deux données (ou plus) égales, faites la moyenne des rangs des données en question. Modifiez ensuite les premiers rangs obtenus par cette moyenne.
-
5Dans la colonne d, indiquez la différence des rangs. Sur la deuxième ligne, vous avez un rang 1 et un rang 3, la différence est de 2. Le signe n'a aucune importance, car la valeur sera ultérieurement élevée au carré.
-
6Élevez au carré les valeurs de la colonne d. Les résultats seront inscrits dans la colonne d2, sur les lignes correspondantes.
-
7
-
8Choisissez une de deux formules.
- Si vous n'avez rencontré aucune corrélation, utilisez la formule de calcul simplifiée du coefficient de corrélation de Spearman ci-dessous :
et remplacez n par le nombre de paires de données de vos séries. Calculez.
- Si vous avez rencontré une quelconque corrélation, utilisez la formule standard du coefficient de Spearman ci-dessous.
- Si vous n'avez rencontré aucune corrélation, utilisez la formule de calcul simplifiée du coefficient de corrélation de Spearman ci-dessous :
-
9Interprétez le résultat obtenu. Il est obligatoirement compris entre -1 et 1.
- Si le coefficient est proche de -1, il y a une forte corrélation négative entre les deux séries.
- Si le coefficient est proche de 0, il n'y a pas de corrélation linéaire entre les deux séries.
- Si le coefficient est proche de 1, il y a une forte corrélation positive entre les deux séries.
Publicité
Méthode 2
Méthode 2 sur 3:Calculer le coefficient de Spearman avec Excel
-
1Préparez vos colonnes. Vous n'aurez besoin que de cinq colonnes. Dans les deux premières colonnes (A et B), entrez vos données. Entrez en C2 la formule =RANK(A2,A$2:A$11) et copiez-la en dessous.
-
2Faites de même avec la colonne D. Entrez en D2 la formule =RANK(B2,B$2:B$11) et copiez-la en dessous.
-
3Tapez la formule de calcul de corrélation des rangs. Entrez en E2 la formule =CORREL(C2:C11,D2:D11), C et D étant les colonnes des rangs. Validez et vous verrez apparaitre le coefficient de corrélation de Spearman.Publicité
Méthode 3
Méthode 3 sur 3:Calculer le coefficient de Spearman avec le langage R
-
1Récupérez le logiciel R. Soit il est déjà installé sur votre ordinateur soit vous le téléchargez à : cette adresse.
-
2Enregistrez vos données dans un fichier CSV. Tapez les données à comparer dans les deux premières colonnes du fichier, puis enregistrez-le.
-
3Ouvrez l'éditeur de R. Sur un terminal, tapez simplement R. Si vous êtes sur le Bureau, doublecliquez sur le logo du logiciel.
-
4Tapez les commandes suivantes :
- tapez d <- read.csv("NOM_DE_VOTRE_FICHIER_CSV.csv"), puis validez,
- tapez cor(rank(d[,1]),rank(d[,2])).
Publicité
Conseils
- Pour avoir un coefficient de Spearman qui ait un sens, vous devez utiliser au moins 5 paires de données afin de dégager une tendance. Ici, nous n'avons utilisé que trois paires pour la clarté du propos.
Avertissements
- Le coefficient de corrélation de Spearman permet seulement de mesurer le degré de corrélation entre des données qui croissent ou décroissent en même temps. Si vous tracez un diagramme de dispersion des données, le coefficient de Spearman ne fournira pas une représentation précise de cette corrélation.
- Cette formule est basée sur l'hypothèse qu'il n'y a pas de corrélation entre les variables. Lorsqu'il existe une corrélation comme celle vue dans l'exemple, vous devez utiliser l'indice de corrélation de Pearson basé sur les rangs.