Distribución T² de Hotelling
En estadística la distribución T² (T-cuadrado) de Hotelling es importante porque se presenta como la distribución de un conjunto de estadísticas que son una generalización natural de las estadísticas subayacentes distribución t de Student. En particular, la distribución se presenta en estadísticas multivariadas en pruebas de diferencias entre las medias (multivariadas) de diferentes poblaciones, donde las pruebas para problemas univariados usarían la Prueba t. Es proporcional a la distribución F.
La distribución recibe su nombre de Harold Hotelling, quien la desarrollo[1] como una generalización de la distribución t de Student.
Definición
Si el vector tiene distribución normal multivariada con media cero y matriz de covarianza unitaria y es una matriz de tamaño con matriz unitaria escalada y los grados de libertad con distribución de Wishart entonces la forma cuadrática tiene distribución de Hotelling con parámetros y :
Si la variable aleatoria tiene distribución T-cuadrado de Hotelling con parámetros y , , entonces
donde es la distribución F con parámetros y .
Estadística T-cuadrado de Hotelling
La estadística T-cuadrado de Hotelling es una generalización de la estadística t de Student que se usa en las pruebas de hipótesis multivariadas, y se define como sigue:[1]
Sea , que denota una distribución normal p-variada con vector de medias y covarianza . Sean
variables aleatorias independientes, las cuales pueden representarse como un vector columna de orden de números reales. Defínase
como la media muestral. Puede demostrarse que
donde es una distribución ji-cuadrado con p grados de libertad. Para demostrar eso se usa el hecho que y entonces, al derivar la función característica de la variable aleatoria
Sin embargo, es por lo general desconocida y se busca hacer una prueba de hipótesis sobre el vector de medias .
Defínase
como la covarianza muestral. La traspuesta se ha denotado con un apóstrofo. Se demuestra que es una matriz definida positiva y sigue una distribución Wishart p-variada con n−1 grados de libertad.[2] La estadística T-cuadrado de Hotelling se define entonces como
porque se demuestra que [cita requerida]
es decir
donde es una distribución con parámetros y . Para calcular un p-valor, multiplique la estadística t2 y la constante anterior y use la distribución .
Referencias
- Hotelling, H. (1931). «The generalization of Student's ratio». Annals of Mathematical Statistics 2 (3): 360-378. doi:10.1214/aoms/1177732979.
- K.V. Mardia, J.T. Kent, and J.M. Bibby (1979) Multivariate Analysis, Academic Press.