jueves, 9 de junio de 2016

TEMA 10: HIPÓTESIS ESTADÍSTICAS. TEST DE HIPÓTESIS

CONTRASTES DE HIPÓTESIS

Sirven para controlar los errores aleatorios, además de para responder a preguntas de investigación. La estrategia es la siguiente:
  • Establecer una hipótesis cerca del valor del parámetro
  • Realizar recogida de datos
  • Analizar coherencia entre hipótesis previa y datos obtenidos
  1. Test de Kolmogorov-Smirnov: se utiliza si el tamaño muestral es superior a 50
  2. Test de Shapiro-Wilks: se utiliza si el tamaño muestral es inferior a 50
  • Tipología de variables que participan en hipótesis nula
  • Número de categorías de las variables cualitativas que participan en hipótesis nula
  • Normalidad (o no) de la distribución de las variables cuantitativas
  • Usamos el test de Anova cuando queremos comparar tres o más variables. 
  • Tenemos un valor P que procede de F. Si el valor de F es menor que 0,05 rechazamos la hipótesis nula, si es mayor, la aceptamos (anteriormente explicado).
  • La hipótesis nula (H0) establece que todas las medias son iguales, en cambio la alternativa (Ha) establece que no todas las medias son iguales.
  • Todos los grupos siguen una distribución normal, por lo que tendríamos que hacer pruebas de normalidad (Shapiro o Kolmogorov, dependiendo si el número de sujetos es menor o mayor de 50). 
Para comprender las hipótesis, debemos entender los siguientes conceptos:
  • n= nº de individuos totales
  • i= nº de grupos
  • x= media
  • ni= nº de individuos en el grupo
  • xij= valor de cada individuo dentro del grupo
  • xi= media de cada grupo
NORMALIDAD

Dos pruebas. Ambos son tests no paramétricos: 
Tipos de análisis estadísticos según el tipo de variables implicadas en el estudio:

A la hora de elegir un test debemos tener en cuenta los siguientes aspectos:

Utilizamos Pearson cuando las dos variables (dependiente e independiente) son normales

Utilizamos Spearman cuando una de las dos variables no sigue las distribuciones normales

ERRORES DE HIPÓTESIS

El test de hipótesis mide la probabilidad de error que se comete si se rechaza la hipótesis nula.
Con una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende del error α, que es la probabilidad de equivocarnos al rechazar la hipótesis nula.
Rechazamos H0 para un nivel α máximo del 5% (p< 0.05). Por encima del 5% de error, aceptamos la hipótesis nula. Por debajo de 0,05 rechazamos la hipótesis nula. Es lo que llamamos significación estadística.

Si p=0,00028 rechazo la hipótesis nula(H0)

Si p=0,16 acepto la hipótesis nula(H0)


TIPOS DE ERRORES EN TEST DE HIPÓTESIS
  1. Error de tipo alfa (α): se produce al rechazar la hipótesis nula, cuando ésta es cierta. Aceptamos que podemos equivocarnos hasta un 5%. También llamado falso positivo. Es el más importante.
  2. Error de tipo beta (β): se produce cuando aceptamos la hipótesis nula, siendo ésta falsa. También llamada falso negativo.

TEST CHI-CUADRADO

Esta parte de la teoría la vamos a realizar más práctica, para que sea más interactiva y no todo sea explicación.
Lo aplicamos cuando queremos comparar variables cualitativas (dependiente e independiente). Si al finalizar el estudio nos damos cuenta de que ambas variables no tienen relación entre sí podemos decir que son independientes.
Una vez obtenido el valor de chi-cuadrado, nos vamos a la tabla de distribución.
Grado de libertad (gdl)= (nºcolumnas-1) x (nº filas-1)

Para que os sea más fácil, os adjunto un vídeo explicativo perteneciente a la Universidad de Salamanca. ¡Espero que os sirva!



TEST DE ANOVA

Para hacer ANOVA necesitamos saber que:
Anova calcula:
- Variabilidad entre grupos= (xi-x)2
- Variabilidad dentro de grupos= (xij-xi)2
F= entre los grupos/dentro  de  grupos

Al rechazar la hipótesis nula afirmamos que hay diferencias entre las medias de los grupos, y que éstas son significativas.

TEST DE STUDENT

En un estudio de embarazadas en un centro de  salud cercano a dos asentamientos chabolistas se pretende saber si existen diferencias entre los dos asentamientos en las edades de embarazo en las mujeres que iniciaron la gestación en el último trimestre. Para ello se toman datos de las gestantes:


Determina si existen diferencias significativas en  las edades medias de las gestantes en los dos asentamientos. Asumiendo que la edad en ambos sigue una distribución normal.


Con esta entrada terminamos los temas teóricos de la asignatura, espero que os hayan gustado, y sobre todo, ¡que os hayan servido de ayuda!

No hay comentarios:

Publicar un comentario