Distribución hipergeométrica
En teoría de la probabilidad y estadística, la distribución hipergeométrica es una distribución de probabilidad discreta relacionada con muestreos aleatorios y sin reemplazo. Suponga que se tiene una población de elementos de los cuales, pertenecen a la categoría y pertenecen a la categoría . La distribución hipergeométrica mide la probabilidad de obtener () elementos de la categoría en una muestra sin reemplazo de elementos de la población original.
Distribución Hipergeométrica | ||
---|---|---|
Parámetros |
| |
Dominio | ||
Función de probabilidad (fp) | ||
Media | ||
Moda | ||
Varianza | ||
Coeficiente de simetría | ||
Curtosis |
| |
Función generadora de momentos (mgf) | ||
Función característica | ||
Definición
Función de Probabilidad
Una variable aleatoria discreta tiene una distribución hipergeométrica con parámetros , y y escribimos si su función de probabilidad es
para valores de comprendidos entre y ; donde es el tamaño de población, es el tamaño de la muestra extraída, es el número de elementos en la población original que pertenecen a la categoría deseada y es el número de elementos en la muestra que pertenecen a dicha categoría.
La notación
hace referencia al coeficiente binomial, es decir, el número de combinaciones posibles al seleccionar elementos de un total .
Fórmula recursiva
Si entonces puede demostrarse que
Propiedades
Si entonces cumple algunas propiedades:
El valor esperado de la variable aleatoria es
y su varianza está dada por
La distribución hipergeométrica es aplicable a muestreos sin reemplazo y la binomial a muestreos con reemplazo. En situaciones en las que el número esperado de repeticiones en el muestreo es presumiblemente bajo, puede aproximarse la primera por la segunda. Esto es así cuando N es grande y el tamaño relativo de la muestra extraída, n/N, es pequeño.
Distribuciones Relacionadas
- Si una variable aleatoria entonces .
- Si entonces cuando y de forma tal que .
Véase también
Enlaces externos
- (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última). Cálculo de la probabilidad de una distribución hipergeométrica con R (lenguaje de programación)