Test de Student
En statistique, le test de Student, ou test t[réf. nécessaire], est un ensemble de tests statistiques paramétriques où la statistique de test calculée suit une loi de Student lorsque l’hypothèse nulle est vraie.
Pour la loi de probabilité, voir Loi de Student.
Nature | |
---|---|
Sous-classe de |
Test paramétrique (d) |
Inventeur |
William Gosset (« Student ») |
Histoire
Le test de Student et la loi de probabilités qui lui correspond ont été publiés en 1908 dans la revue Biometrika par William Gosset. Gosset, un employé de la brasserie Guinness à Dublin, y avait développé le test t à des fins de contrôle de la qualité de la production de stout. La brasserie avait pour règle que ses chimistes ne publient pas leurs découvertes. Gosset argua que son article ne serait d'aucune utilité pour les concurrents et obtint l'autorisation de publier mais sous un pseudonyme, Student, pour éviter les difficultés avec les autres membres de son équipe[1]. Le test t est devenu célèbre grâce aux travaux de Ronald Fisher qui montra que ce test ne couvre pas le cas des échantillons de grande taille. Il apporta donc des modifications au test de Student afin de le généraliser.
Exemples d'utilisation
- Comparaison de moyenne d'une loi normale à une valeur si la variance est inconnue.
- Comparaison de deux moyennes issues de deux lois normales si leurs variances sont égales et inconnues, ou si leurs variances sont différentes et inconnues (Test t de Welch).
- Test sur les coefficients dans le cadre d'une régression linéaire.
- Test sur des échantillons appariés
Exemple : test de Student sur un échantillon de loi normale
On veut comparer la moyenne μ d'une population de loi normale et d’écart type σ non connu à une valeur déterminée μ0. Pour ce faire, on tire de cette population un échantillon de taille n dont on calcule la moyenne empirique et l'on remplace sa variance σ2 par son estimateur sans biais
- .
Selon l’hypothèse nulle, la distribution d’échantillonnage de cette moyenne se distribue elle aussi normalement avec un écart type σ√n.
La statistique de test :
suit alors une loi de Student à n – 1 degrés de liberté sous l'hypothèse nulle (c'est le théorème de Cochran).
On choisit un risque α, généralement 0,05 ou 0,01[réf. nécessaire] et l'on calcule la réalisation de la statistique de test :
- où
- Si l'on veut tester H0 : μ = μ0 :
- Si |z| est supérieur au quantile d'ordre 1 – α2 de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.
- Si l'on veut tester H0 : μ ≤ μ0 :
- Si z est supérieur au quantile d'ordre 1 – α de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.
- Si l'on veut tester H0 : μ ≥ μ0 :
- Si z est inférieur au quantile d'ordre α de la loi de Student à n – 1 degrés de liberté alors on rejette l'hypothèse nulle.
Remarque : si l'on note tk, α le quantile d'ordre α de la loi de Student à k degrés de liberté alors on a l'égalité tk, α = – tk, 1 – α.
Implémentation
Langage/Logiciel | Fonction | Notes |
---|---|---|
R | t.test | |
SAS | PROC TTEST | |
Python | scipy.stats.ttest_ind | |
Matlab | ttest | |
Mathematica | TTEST | |
Stata | ttest | |
Julia | OneSampleTTest
EqualVarianceTTest |
Notes et références
- Harold Hotelling (1930, p. 189) dans un article de British statistics cité par S. L. Zabell dans On Student's 1908 paper "The probable error of the mean", Journal of the American Statistical Association 103 (2008), p. 1-7 DOI:10.1198/016214508000000030 JSTOR:27640017
Voir aussi
- Portail des probabilités et de la statistique