Théorème de Rao-Blackwell
En statistique, le théorème de Rao-Blackwell permet à partir d'un estimateur de construire un estimateur plus précis grâce à l'usage d'une statistique exhaustive. L'avantage de ce théorème est que l'estimateur initial n'a pas nécessairement besoin d'être très bon pour que l'estimateur que ce théorème construit fournisse de bons résultats. Il suffit en effet que l'estimateur de départ soit sans biais pour pouvoir construire un nouvel estimateur. L'estimateur de départ n'a entre autres pas besoin d'être convergent ou efficace.
Nature | |
---|---|
Nommé en référence à | |
Formule |
Théorème
Si est un estimateur sans biais et S une statistique exhaustive alors l'estimateur augmenté a une variance plus faible que la variance de l'estimateur initial. L'estimateur augmenté est donc toujours plus précis que l'estimateur initial si on l'augmente d'une statistique exhaustive.
Dans le cas multiparamétrique où l'estimateur et le paramètre sont en dimensions plus grandes que 1 on remplace la variance par la matrice de variance-covariance A. Le théorème de Rao-Blackwell donne alors:
Quel que soit A définie positive, l'erreur quadratique en utilisant le produit scalaire défini par A est toujours plus faible pour l'estimateur augmenté que pour l'estimateur initial.
Le fait de pouvoir prendre n'importe quel produit scalaire et non seulement le produit scalaire usuel peut être très utile pour que les différentes composantes ne soient pas normées de la même façon. Ceci peut par exemple être le cas si une erreur sur l'une ou l'autre des composantes "coute plus cher" on pourra choisir une matrice de produit scalaire en fonction. L'estimateur augmenté sera toujours préférable même avec ce produit scalaire non usuel.
En fait le théorème de Rao Blackwell donne légèrement plus vu qu'il dit que quelle que soit la fonction de perte convexe L, . L'estimateur augmenté est donc toujours plus précis et ce quelle que soit la définition (raisonnable) que l'on donne à "précis".
Exemple
On considère donc n variables aléatoires iid distribués selon des lois de Poisson de paramètre et l'on cherche à estimer . On peut montrer assez facilement en considérant le critère de factorisation que est une statistique exhaustive. Pour montrer l'intérêt de ce théorème on prend un estimateur grossier de qui vaut 1 si et 0 sinon. Cet estimateur ne prend en compte qu'une seule valeur de X alors qu'on en dispose de n et il ne donne pour résultat que 0 ou 1 alors que la valeur de appartient à l'intervalle ]0,1] et ne vaut sans doute pas 1. (si c'était le cas vaudrait 0 de façon déterministe et on s'en serait aperçu en regardant les données). Pourtant bien que cet estimateur soit très grossier, l'estimateur augmenté obtenu est très bon et on peut même montrer qu'il est optimal. L'estimateur augmenté vaut:
On peut montrer que:
Et avec l'indépendance de :
Si suit une loi de Poisson de paramètre alors la fonction génératrice vaut . Avec les propriétés de la fonction génératrice on en déduit que la somme de n variables iid suivant des lois de Poisson de paramètre est une loi de Poisson de paramètre . On en déduit les probabilités et suis une loi binomiale B(S,1/n). La valeur en k=0 nous donne l'estimateur . En effet,est tout comme un estimateur de mais a l'avantage d'être beaucoup plus précis grâce à l'application du théorème de Rao–Blackwell.
On peut montrer que est un estimateur optimal de (Voir Théorème de Lehmann-Scheffé) mais que l'estimateur optimal pour est différent de .
En fait bien que soit un estimateur convergent de c'est un estimateur de relativement mauvaise qualité car il est biaisé et qu'en l'estimant de la sorte on fait une erreur systématique sur l'estimation. De façon générale il peut être intéressant pour estimer de construire un estimateur spécifique plutôt que de calculer la valeur prise par par l'estimateur de .
Voir aussi
Références
- A. Montfort Cours de statistique mathématique, 1982, Economica. Paris.
Liens externes
- P. Druilhet « http://www.ensai.com/upload/files/BIBFILE_FILE_KcEegDc.pdf »(Archive.org • Wikiwix • Archive.is • Google • Que faire ?) Cours de statistique interférentielle.
- Portail des probabilités et de la statistique