Fonction de répartition empirique
En statistiques, une fonction de répartition empirique est une fonction de répartition qui attribue la probabilité 1/n à chacun des n nombres dans un échantillon.
Soit X1,...,Xn un échantillon de variables iid définies sur un espace de probabilité , à valeurs dans , avec pour fonction de répartition F. La fonction de répartition empirique de l'échantillon est définie par :
où est la fonction indicatrice de l'événement A.
Pour chaque ω, l'application est une fonction en escalier, fonction de répartition de la loi de probabilité uniforme sur l'ensemble .
Pour chaque x, la variable aléatoire est une variable aléatoire de Bernoulli, de paramètre p=F(x). Par conséquent, la variable aléatoire , qu'on notera , est distribuée selon une loi binomiale, avec pour moyenne nF(x) et pour variance nF(x)(1 − F(x)). En particulier, Fn(x) est un estimateur non-biaisé de F(x).
Propriétés asymptotiques
- Par la loi forte des grands nombres,
- pour tout x, presque sûrement.
- Par le théorème central limite,
- converge en loi vers une loi normale pour un x fixé.
- Le théorème de Berry–Esseen procure le taux de convergence.
- Par le théorème de Glivenko-Cantelli, presque sûrement, la convergence uniforme a lieu, ou bien, de manière équivalente :
- L' inégalité de Dvoretzky-Kiefer-Wolfowitz procure le taux de convergence.
- Kolmogorov a montré que
- converge en distribution vers la distribution de Kolmogorov, à condition que F soit continue.
- Le test de Kolmogorov-Smirnov de goodness-of-fit est basé sur ce fait.
- Par le théorème de Donsker,
- , en tant que processus indexé par x, converge faiblement dans vers un pont brownien B(F(x)).
Bibliographie
- (en) Galen R. Shorack et Jon A. Wellner, Empirical Processes With Applications to Statistics, Society for Industrial & Applied Mathematics, , 998 p. (ISBN 978-0-89871-684-9 et 0-89871-684-5, lire en ligne)
- van der Vaart, A.W. and Wellner, J.A. (1996) "Weak Convergence and Empirical Processes", Springer. (ISBN 0-387-94640-3).
- Portail des probabilités et de la statistique