La somme des carrés des résidus (ou SCR) est une valeur statistique qui ne sert en soi à rien, mais qui peut être utilisée pour calculer d'autres mesures plus intéressantes. Dans l'étude d'une série statistique, il est toujours intéressant de connaitre le degré de corrélation des valeurs de la série et la SCR y contribue. Comme le calcul de cette dernière s'effectue en plusieurs temps, il est utile de s'aider d'un tableau dans lequel apparaitront les différents calculs, au demeurant fort simples. Une fois obtenue la somme des carrés des résidus d'une série statistique, vous pourrez calculer d'autres valeurs, comme la variance et l'écart-type.

Méthode 1
Méthode 1 sur 3:
Calculer une SCR à la main

  1. 1
    Tracez un tableau à trois colonnes. À la main, la façon la plus pratique de calculer la somme des carrés des résidus est de faire un tableau à trois colonnes. Elles auront pour entêtes Valeur, Écart à la moyenne et Écart à la moyenne au carré [1] .
  2. 2
    Inscrivez vos données. Dans la première colonne, celle intitulée Valeur, vous mettrez l'une sous l'autre toutes vos valeurs, l'ordre d'inscription n'a pas d'importance pour la suite. Ces valeurs peuvent provenir d'une expérience, d'une étude statistique ou encore vous être données si vous êtes dans le cadre d'un exercice scolaire [2] .
    • Prenons un exemple théorique, mais concret. Supposons que des prélèvements sanguins aient fait sur dix patients pour connaitre leurs pressions partielles d'oxygène. La pression généralement admise doit être comprise entre 80 et 105 mm Hg. Voici donc les mesures qui ont été trouvées chez ces dix patients : 99,0 - 98,6 - 98,5 - 101,1 - 98,3 - 98,6 - 97,9 - 98,4 - 99,2 - 99,1. Inscrivez ces valeurs dans la première colonne.
  3. 3
    Calculez la moyenne. Avant de calculer l'écart pour chaque mesure, vous devez calculer la moyenne arithmétique de l'ensemble de l'échantillon [3] .
    • Nous vous rappelons que la moyenne d'une série de valeurs est la somme de ces valeurs divisée par le nombre de valeurs de l'échantillon. Conventionnellement, cette moyenne est identifiée par la lettre , comme « moyenne » :
    • Pour notre exemple, la moyenne se calcule comme suit :


  4. 4
    Calculez les différents écarts à la moyenne. Dans la deuxième colonne se trouveront tous les écarts à la moyenne de chacune des valeurs de départ. L'écart à la moyenne est tout simplement la différence entre la valeur en question et la moyenne [4] .
    • Pour l'exemple que nous avons pris, celui des dix patients, ôtez la moyenne, soit 98,87, de chacune des valeurs de l'échantillon, et inscrivez-la en face de la valeur de départ, mais dans la deuxième colonne. Ici, cela donne :
  5. 5
    Élevez les écarts au carré. Une fois les écarts calculés, élevez chacun d'eux au carré et inscrivez le résultat sur la même ligne, mais dans la troisième colonne. Ainsi, sur la même ligne, vous avez de gauche à droite : la valeur de départ, son écart à la moyenne et ce même écart, mais au carré [5] .
    • Reprenons notre exemple des dix patients. Munissez-vous d'une calculatrice et trouvez le carré de chacun des écarts. Le résultat va dans la troisième colonne, comme suit :
  6. 6
    Additionnez tous les écarts au carré. La dernière étape, très simple, consiste à additionner toutes les valeurs de la troisième colonne : vous obtenez la somme des carrés des résidus (SCR).
    • Reprenons notre exemple des dix patients, la SCR pour cet échantillon consiste à additionner toutes les dix valeurs de la troisième colonne, ce qui donne :
    Publicité

Méthode 2
Méthode 2 sur 3:
Créer un tableur Excel pour calculer une SCR

  1. 1
    Donnez des noms aux colonnes. Comme précédemment, vous devez créer un tableur Excel de trois colonnes, chacune portant un entête.
    • Dans la cellule A1, tapez comme entête Valeur.
    • Dans la cellule B1, tapez comme entête Écart à la moyenne.
    • Dans la cellule C1, tapez comme entête Écart à la moyenne au carré.
  2. 2
    Entrez vos données. Dans la première colonne, vous taperez l'une sous l'autre toutes vos valeurs, l'ordre d'inscription n'a pas d'importance pour la suite. Si l'échantillon comporte peu de données, tapez-les à la main, s'il est plus grand et déjà dans un tableur, copiez-le et collez-le dans cette première colonne.
  3. 3
    Calculez la moyenne de ces données. Excel propose une fonction qui calcule automatiquement les moyennes. Dans une des cellules libres (disons la A104) située sous la colonne des valeurs, entrez la formule suivante [6] .
    • =MOYENNE(A2:___)
    • En fait, ne tapez pas un espace blanc. Tapez en deuxième position la référence de la dernière cellule de vos données. Ainsi, si vous avez un échantillon de 100 données, la formule de calcul de la moyenne sera la suivante :
      • =MOYENNE(A2:A101)
      • A2 est la première cellule avec la première donnée et A101 est la dernière cellule avec la dernière donnée. La cellule A1, quant à elle, est occupée par l'entête.
    • Si vous appuyez sur la touche Entrée (validation), ou si vous cliquez dans n'importe quelle cellule du tableur, la moyenne de vos données apparait automatiquement dans la cellule que vous venez de programmer.
  4. 4
    Tapez la formule de calcul de l'écart à la moyenne. Dans la première cellule vide, sous l'entête Écart à la moyenne, vous allez devoir entrer une formule qui permettra le calcul de la différence entre la donnée de cette première ligne et la moyenne. Vous allez aussi avoir besoin de la référence de la cellule où se trouve la moyenne : nous avions décidé précédemment qu'elle serait dans la A104 [7] .
    • Dans la cellule B2, entrez la fonction qui permet de calculer l'écart. Elle est la suivante :
      • =A2-$A$104. Les deux dollars sont là pour figer la cellule : si vous déplacez la cellule B2 pour la mettre en D2, le « $A$104 » ne bougera pas.
  5. 5
    Tapez la formule de calcul du carré de l'écart à la moyenne. Dans la troisième colonne, vous pouvez programmer Excel pour qu'il calcule pour vous le carré de la cellule immédiatement à gauche [8] .
    • Dans la cellule C2, entrez la fonction :
      • = PUISSANCE(B2;2)
  6. 6
    Copiez les deux formules pour remplir le tableau. Votre première ligne, A2-B2-C2 est désormais remplie, reste à remplir les lignes suivantes. Bien sûr, vous pourriez recommencer pour chaque ligne le travail que vous venez de faire, mais ce serait bien fastidieux. À l'aide de votre souris, cliquez dans la cellule B2, puis, sans lâcher le bouton de la souris, allez sur C2. Enfin, en tenant toujours le bouton de la souris enfoncé, descendez jusqu'aux dernières cellules du tableau. Relâchez le bouton, les cellules des colonnes B et C sont pleines.
    • Ainsi, si votre tableau comporte 100 lignes, le bouton de la souris toujours enfoncé, descendez le curseur jusqu'aux cellules B101 et C101.
    • Dès que vous relâchez le bouton de la souris, toutes les cellules de B et C sont remplies avec les fonctions du haut du tableau. Il va de soi que les calculs se font alors automatiquement et les fonctions sont remplacées par les résultats numériques.
  7. 7
    Trouvez la SCR. Désormais, la colonne C de votre tableau contient tous les écarts au carré. La dernière étape consiste à programmer une cellule pour qu'elle fasse la somme des valeurs de cette colonne [9] .
    • Dans une des cellules au bas de la colonne C, en C102 ou en C103, entrez la fonction suivante :
      • =SOMME(C2:C101)
    • Si vous appuyez sur la touche Entrée (validation), ou si vous cliquez dans n'importe quelle cellule du tableur, la somme apparait automatiquement dans la cellule en question.
    Publicité

Méthode 3
Méthode 3 sur 3:
Utiliser une SCR pour calculer d'autres mesures statistiques

  1. 1
    Calculez une variance à partir d'une SCR. La somme des carrés des résidus n'est qu'une étape vers le calcul d'autres outils statistiques. Le premier d'entre eux est la célèbre « variance ». Elle sert à caractériser la dispersion d'un échantillon, c'est-à-dire la position de chaque donnée par rapport à la moyenne. Elle est ainsi la moyenne des écarts à la moyenne au carré [10] .
    • La SCR étant la somme des écarts à la moyenne au carré, il vous est très facile de trouver la variance en divisant cette somme par l'effectif de la série (nombre de valeurs, appelé n), la variance étant la moyenne des écarts au carré. Cependant, si vous travaillez sur un échantillon, et non sur une population entière, vous devez diviser par (n-1), et non par n.
      • Pour calculer la variance (V) d'une population entière, vous devez utiliser la formule : .
      • Pour calculer la variance (V) d'un échantillon d'une population entière, vous devez utiliser la formule : .
    • En reprenant l'exemple des dix patients, on peut supposer sans risque de beaucoup se tromper qu'il ne s'agit que d'un échantillon très limité. Aussi emploiera-t-on la formule suivante :




  2. 2
    Calculez l'écart-type à partir de la SCR. L'écart-type permet de mesurer la dispersion d'un échantillon donné par rapport à la moyenne de ses données. L'écart-type est défini comme la racine carrée de la variance, laquelle est, rappelons-le, la moyenne des écarts à la moyenne au carré [11] .
    • En conséquence, après avoir calculé la SCR, vous trouverez l'écart-type en procédant ainsi :
    • Avec l'exemple pris précédemment, celui des dix patients, vous devez faire le calcul suivant :






  3. 3
    Servez-vous de la SCR pour calculer la covariance. Dans cet article, nous nous sommes intéressés à des données qui étaient toutes de la même nature, mais en statistiques, on a souvent deux données dont on cherche à mesurer le degré de corrélation. Les moyennes de deux séries sont de peu de secours en ce cas. Ce degré de corrélation se mesure par la covariance [12] .
    • Le calcul de la covariance, parce que trop complexe, n'entre pas dans le cadre de cet article, mais sachez que la covariance, comme la variance, peut être calculée à partir de la SCR. Si vous voulez en savoir plus sur la covariance, lisez cet excellent article.
    • Pour reprendre notre exemple du début, vous pouvez, par exemple, étudier la corrélation entre l'âge des patients et l'efficacité d'un médicament régulateur de la pression d'oxygène. D'un côté, vous avez une première série de données (âge des patients), et de l'autre côté, une seconde série, apparemment non corrélée à la première, celle des pressions partielles d'oxygène. Calculez la SCR pour chacune des séries, puis la variance, l'écart-type et la covariance. Cela fait, vous pourrez dire si la corrélation entre les deux éléments est importante ou non.
    Publicité

À propos de ce wikiHow

l'équipe de wikiHow
Coécrit par:
Rédacteurs de wikiHow
Cet article a été rédigé avec la collaboration de nos éditeurs(trices) et chercheurs(euses) qualifiés(es) pour garantir l'exactitude et l'exhaustivité du contenu.

L'équipe de gestion du contenu de wikiHow examine soigneusement le travail de l'équipe éditoriale afin de s'assurer que chaque article est en conformité avec nos standards de haute qualité. Cet article a été consulté 21 881 fois.
Catégories: Calculs
Publicité