Cómo evaluar la significancia estadística

La prueba de hipótesis está guiada por el análisis estadístico. La significancia estadística se calcula usando un valor p, el cual te dice la probabilidad de que tu resultado se observe dado que una determinada afirmación (la hipótesis nula) sea verdadera.^{[1]
X
Fuente de investigación} Si este valor p es menor al nivel de significancia establecido (generalmente 0,05), el experimentador puede asumir que la hipótesis nula es falsa y aceptar la hipótesis alternativa. Usando una simple prueba t, puedes calcular un valor p y determinar la significancia entre dos grupos diferentes de un conjunto de datos.

Parte 1

Parte 1 de 3:
Organizar tu experimento

1
Define tus hipótesis. El primer paso para evaluar la significancia estadística es definir la pregunta a la que quieres responder y declarar tu hipótesis. La hipótesis es una afirmación sobre tus datos experimentales y las diferencias que podrían ocurrir en la población. Para cualquier experimento, hay tanto una hipótesis nula como una hipótesis alternativa.^{[2]
X
Fuente de investigación} Por lo general, compararás dos grupos para ver si son iguales o diferentes.
- La hipótesis nula (H₀) generalmente afirma que no hay diferencia entre tus dos conjuntos de datos. Por ejemplo: los estudiantes que leen el material antes de la clase no obtienen calificaciones finales más altas.
- La hipótesis alternativa (H_a) es lo contrario a la hipótesis nula y es la afirmación que tratas de respaldar con tus datos experimentales. Por ejemplo: los estudiantes que leen el material antes de la clase sí obtienen calificaciones finales más altas.
2
Establece el nivel de significancia para determinar cuán inusuales deben ser tus datos antes de poder ser considerados significativos. El nivel de significancia (también llamado alfa) es el umbral que estableces para determinar la significancia. Si tu valor p es menor o igual al nivel de significancia establecido, los datos se consideran estadísticamente significativos.^{[3]
X
Fuente de investigación}
- Como regla general, el nivel de significancia (o alfa) se establece comúnmente como 0,05, lo que significa que la probabilidad de observar las diferencias en los datos al azar es de solo el 5 %.
- Un nivel de confianza más alto (y, por lo tanto, un valor p más bajo) significa que los resultados son más significativos.
- Si quieres una mayor confianza en tus datos, establece el valor p a 0,01. Los valores p más bajos generalmente se usan en la manufactura al detectar defectos en productos. Es muy importante tener una confianza alta en que todas las partes funcionarán exactamente como deben.
- Para la mayoría de los experimentos impulsados por hipótesis, un nivel de significancia de 0,05 es aceptable.
3
Elige usar una prueba de una o dos colas. Una de las suposiciones que hace una prueba t es que los datos están distribuidos normalmente. Una distribución normal de datos forma una curva de campana, estando la mayoría de las muestras en el medio.^{[4]
X
Fuente de investigación} La prueba t es una prueba matemática para ver si los datos se encuentran fuera de la distribución normal, ya sea por encima o por debajo, en las "colas" de la curva.
- Si no estás seguro sobre si tus datos estarán por encima o por debajo del grupo de control, usa una prueba de dos colas. Esto te permite probar la significancia en cualquier dirección.
- Si sabes en cuál dirección esperas que tus datos tiendan, usa una prueba de una cola. En el ejemplo dado, esperas que las calificaciones de los estudiantes mejoren; por lo tanto, usarás una prueba de una cola.
4
Determina el tamaño de la muestra con un análisis de potencia. La potencia de una prueba es la probabilidad de observar el resultado esperado dado un tamaño específico de la muestra.^{[5]
X
Fuente de investigación} El umbral común para la potencia (o beta) es de 80 %. Un análisis de potencia puede ser un poco complicado sin algunos datos preliminares ya que necesitas información sobre tus medios esperados entre cada grupo y sus desviaciones estándar. Usa una calculadora de análisis de potencia en línea para determinar el tamaño óptimo de muestra para tus datos.^{[6]
X
Fuente de investigación}
- Los investigadores generalmente realizan un pequeño estudio piloto para informar su análisis de potencia y determinar el tamaño necesario de la muestra para un estudio más extenso.
- Si no tienes los medios para realizar un estudio piloto complejo, realiza algunos estimados sobre posibles medios con base en la lectura de la literatura y los estudios que otras personas puedan haber realizado. Esto te dará un buen lugar para empezar en cuanto al tamaño de la muestra.
Anuncio

Parte 2

Parte 2 de 3:
Calcular la desviación estándar

1
Define la fórmula para la desviación estándar. La desviación estándar es una medida de cuán distribuidos están los datos. Te da información sobre cuán similar es cada punto de datos dentro de la muestra. A primera vista, la ecuación puede parecer un poco complicada pero estos pasos te guiarán a través del proceso de cálculo. La fórmula es s = √∑((x_i - µ)²/(N – 1)).
- s es la desviación estándar.
- ∑ indica que sumarás todos los valores de muestra reunidos.
- x_i representa cada valor individual de tus datos.
- µ es el promedio (o la media) de tus datos para cada grupo.
- N es el número total de la muestra.
2
Promedia las muestras en cada grupo. Para calcular la desviación estándar, primero debes tomar el promedio de las muestras en los grupos individuales. El promedio está designado con la letra griega mu o µ. Para hacerlo, simplemente suma cada muestra y luego divide el resultado entre el número total de muestras.^{[7]
X
Fuente de investigación}
- Por ejemplo, para encontrar la calificación promedio del grupo que leyó el material antes de la clase, observemos algunos datos. Por simplicidad, usaremos un conjunto de datos de 5 puntos: 90, 91, 85, 83 y 94.
- Suma todas las muestras: 90 + 91 + 85 + 83 + 94 = 443.
- Divide la suma entre el número de muestras, N = 5: 443/5 = 88,6.
- La calificación promedio para este grupo es de 88,6.
3
Resta cada muestra al promedio. La siguiente parte del cálculo involucra la parte (x_i - µ) de la ecuación. Restarás cada muestra al promedio que acabas de calcular. Para nuestro ejemplo, terminarás con cuatro restas.
- (90 - 88,6), (91- 88,6), (85 - 88,6), (83 - 88,6) y (94 - 88,6).
- Los números calculados son ahora 1,4, 2,4, -3,6, -5,6 y 5,4.
4
Eleva cada uno de estos números al cuadrado y súmalos. Cada uno de estos nuevos números que acabas de calcular ahora será elevado al cuadrado. Este paso también eliminará cualquier signo negativo. Si tienes un signo negativo después de este paso o al final de tu cálculo, es posible que hayas olvidado este paso.
- En nuestro ejemplo, ahora trabajamos con 1,96, 5,76, 12,96, 31,36 y 29,16.
- Sumar estos resultados produce 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
5
Divide entre el número total de muestras menos 1. La fórmula divide entre N - 1 porque corrige el hecho de que no has contado una población entera sino que has tomado una muestra de la población de todos los estudiantes para hacer un estimado.^{[8]
X
Fuente de investigación}
- Resta: N - 1 = 5 - 1 = 4
- Divide: 81,2/4 = 20,3
6
Saca la raíz cuadrada. Una vez que hayas dividido entre el número de muestras menos 1, saca la raíz cuadrada de este número final. Este es el último paso para calcular la desviación estándar. Existen programas de estadística que harán este cálculo por ti después de ingresar los datos sin procesar.
- Para nuestro ejemplo, la desviación estándar de las calificaciones finales de los estudiantes que leyeron antes de la clase es s =√20,3 = 4,51.
Anuncio

Parte 3

Parte 3 de 3:
Determinar la significancia

1
Calcula la varianza entre tus dos grupos de muestra. Hasta este punto, el ejemplo solo ha lidiado con uno de los grupos de muestra. Si tratas de comparar dos grupos, obviamente tendrás datos de ambos. Calcula la desviación estándar del segundo grupo de muestras y úsala para calcular la varianza entre los dos grupos experimentales. La fórmula para la varianza es s_d = √((s₁/N₁) + (s₂/N₂)).^{[9]
X
Fuente de investigación}
- s_d es la varianza entre los grupos.
- s₁ es la desviación estándar del grupo 1 y N₁ es el tamaño de la muestra del grupo 1.
- s₂ es la desviación estándar del grupo 2 y N₂ es el tamaño de la muestra del grupo 2.
- Para nuestro ejemplo, digamos que los datos del grupo 2 (estudiantes que no leyeron antes de la clase) tuvieron un tamaño de muestra de 5 y una desviación estándar de 5,81. La varianza es:
  - s_d = √((s₁)²/N₁) + ((s₂)²/N₂))
  - s_d = √(((4,51)²/5) + ((5,81)²/5)) = √((20,34/5) + (33,76/5)) = √(4,07 + 6,75) = √10,82 = 3,29.
2
Calcula la puntuación t de tus datos. Una puntuación t te permite convertir tus datos en una forma que te permita compararlos con otros datos. Las puntuaciones t te permiten realizar una prueba t que te permita calcular la probabilidad de que dos grupos sean significativamente diferentes uno de otro. La fórmula para una puntuación t es t = (µ₁ - µ₂)/ s_d.^{[10]
X
Fuente de investigación}
- µ₁ es el promedio del primer grupo.
- µ₂ es el promedio del segundo grupo.
- s_d es la varianza entre las muestras.
- Usa el promedio más grande como µ₁ de forma que no tengas un valor negativo de t.
- Para nuestro ejemplo, digamos que el promedio de la muestra para el grupo 2 (aquellos que no leyeron) fue 80. La puntuación t es t = (µ₁ - µ₂)/s_d = (88,6 - 80)/3,29 = 2,61.
3
Determina los grados de libertad de tu muestra. Al usar la puntuación t, el número de grados de libertad se determina usando el tamaño de la muestra. Suma el número de muestras de cada grupo y luego resta 2. Para nuestro ejemplo, los grados de libertad (gl) son 8 porque hay cinco muestras en el primer grupo y cinco muestras en el segundo ((5 + 5) - 2 = 8).^{[11]
X
Fuente de investigación}
4
Usa una tabla para evaluar la significancia. Puedes encontrar una tabla de puntuaciones t^{[12]
X
Fuente de investigación} y grados de libertad en un libro de estadística estándar o en línea. Observa la fila que contenga los grados de libertad de tus datos y busca el valor p que corresponda con la puntuación t.
- Con 8 gl y una puntuación t de 2,61, el valor p para una prueba de una cola se encuentra entre 0,01 y 0,025. Debido a que establecimos el nivel de significancia como menor o igual a 0,05, nuestros datos son estadísticamente significativos. Con estos datos, rechazamos la hipótesis nula y aceptamos la hipótesis alternativa:^{[13]
  X
  Fuente de investigación} los estudiantes que leen el material antes de clase obtienen mejores calificaciones finales.
5
Considera un estudio de seguimiento. Muchos investigadores realizan un pequeño estudio piloto con unas cuantas medidas para ayudarlos a comprender cómo diseñar un estudio más grande. Realizar otro estudio con otras medidas ayudará a incrementar tu confianza en tu conclusión.

Anuncio

Consejos

La estadística es un área grande y complicada. Toma un curso a nivel escolar o universitario (o más avanzado aún) sobre la interferencia estadística para ayudarte a comprender la significancia estadística.

Anuncio

Advertencias

Este análisis es específico para una prueba t para probar las diferencias entre dos poblaciones normalmente distribuidas. Es posible que tengas que usar una prueba estadística diferente dependiendo de la complejidad de tu conjunto de datos.

Anuncio