jueves, 9 de junio de 2016

TEMA 9: ESTADÍSTICA INFERENCIAL. MUESTREO Y ESTIMACIÓN

INFERENCIA ESTADÍSTICA
Al plantear un estudio en el ámbito sanitario, debemos mostrar interés en todos los pacientes similares a los que vamos a estudiar. A esto se denomina como inferir. Podemos definir distintos conceptos:
  • Población de estudio: conjunto de pacientes sobre los que queremos estudiar alguna cuestión
  • Muestra: conjunto de individuos concretos que participan en el estudio
  • Tamaño muestral: número de individuos de la muestra
  • Interferencia estadística: conjunto de procedimientos estadísticos que permiten pasar de lo particular (muestra) a lo general (población) 
  • Técnicas de muestreo: conjunto de procedimientos que permiten elegir muestras de tal forma que reflejen las características de la población 
  • Si la muestra se elige al azar, el error se evalúa mediante muestreo probabilístico o aleatorio, y el error se llama error aleatorio.
  • En los muestreos no  probabilísticos no se puede evaluar el error. 
  • Cuanto mayor sea el tamaño de la muestra, favorezco la reducción del error aleatorio por probabilidad.
  1. Para una media: es la desviación estándar de la estimación promedio de muestra de una media de la población. La calculadora de Error estándar utiliza la fórmula para calcular que el error estándar de la media es :
  1. Para una proporción: mientras mayor sea el tamaño de una muestra, menor será el error estándar.
TEOREMA CENTRAL DEL LÍMITE:
  • Probabilístico: todos los sujetos tienen probabilidad de ser seleccionados
  1. Aleatorio simple
  • De rifa: le ponemos un número a cada miembro de la población, calculamos el tamaño muestral y seleccionamos aleatoriamente el número. Cuando la población es muy grande usamos el aleatorio sistemático.
  • Tabla de números aleatorios: si disponemos de una lista de la población deestudio en una base de datos. Más económico y en menos tiempo
    2. Aleatorio sistemático: similar al aleatorio simple pero para poblaciones más grandes.

   3. Estratificado: se produce una subdivisión en subgrupos, debido a que las variables presentan una distribución que puede afectar a los resultados.
    
   4. Conglomerados: si no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman la población y resulta difícil elaborarla. En la elección de la muestra se cogen subgrupos. El investigador no conoce la distribución de la variable.

  • No probabilístico/de conveniencia para el investigador: hay personas que no tienen probabilidad de ser seleccionados, y no se realiza de forma aleatoria, las muestras las ellige el investigador.
  1. Accidental: se utilizan las personas disponibles en un momento dado
  2. Por cuotas: un % a un grupo y otro % a otro grupo
  3. Por conveniencia: el investigador selecciona las muestras dependiendo de sus objetivos

TAMAÑO DE LA MUESTRA

El tamaño de la muestra depende de:
  • Si se cumple el resultado: N > n(n-1), el cálculo del tamaño muestral termina aquí.
  • Si no se cumple, obtendremos el tamaño de la muestra con esta fórmula: n´=n/1+(n/N)
PROCESO DE LA INFERENCIA ESTADÍSTICA

Tenemos una población de estudio, y la medida que queremos obtener se denomina parámetro.
Hacemos una selección aleatoria y obtenemos una muestra. La medida de la variable de estudio obtenida en dicha muestra se denomina estimador.
Al proceso por el que,a partir del estimador me aproximo al parámetro se denomina inferencia.

A continuación, os adjunto un ejemplo práctico:

Estudio tiempos de curación de úlceras en muestra de 100 pacientes.
-            Media del tiempo muestra 1=53,77 días.
-            Media del tiempo muestra 2=57,08 días.

Construimos un histograma con los estimadores de la media de tratamiento calculados en 200 muestras (200 estudios distintos, y de todos calculamos la media) distintas de 100 pacientes cada una. El histograma es una campana de Gauss, por lo tanto seguiría una distribución normal. Esto significa que utilizando los principios que siguen las distribuciones normales puedo hacer inferencias. 
Siempre saldría así debido a que tendría una distribución normal. Esto nos permite calcular el error estándar. Que es el error que asumimos cuando seleccionamos una muestra probabilística. La variabilidad de los estimadores anteriores se conoce como error estándar.


ERROR ESTÁNDAR

Es la medida que trata de captar la variabilidad de los valores del estimador. Mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.  Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta. 

CÁLCULO
Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador de que se trate.

Si en vez de una muestra, se seleccionara 100 muestras y calculara las medias y las pusiera en un histograma, tendría una distribución normal, en la que el error estándar coincide con la desviación estándar del histograma, por lo que si le sumo y le resto a la media una vez la desviación estándar (error estándar), tendré el 68.26% de las observaciones. 

INTERVALOS DE CONFIANZA

Son un medio de conocer el parámetro en una población midiendo el error aleatorio. Son un par de números con los que  podemos asegurar que el valor del parámetro es mayor o menor que ambos números. 

Cálculo:

Z: depende del nivel de confianza 1-α con que se quiera dar el intervalo (α=error máximo admisible, 5%). 
- Para nivel de confianza 95%     Z=1,96.
- Para nivel de confianza 99%     Z=2,58.
- Cuando se elija el signo negativo se conseguirá el extremo inferior del intervalo y cuando se elija el positivo se tendrá el extremo superior

A continuación os adjunto un ejemplo:
En una investigación sobre la obesidad en la población femenina adscrita en el centro de salud se obtiene un resultado sobre una muestra representativa que el peso medio de la muestra es de 69.6 kg. Y su desviación típica es de 9.8. se pide que se calcule el intervalo de confianza de la media del peso en toda la población adulta femenina adscrita al centro de salud para un 95 y 99 % de confianza.
N:233
S: 9.8
Media: 69.6
E=s/√n   e=9.8/√233 = 0.6     
IC95%= 69.6+-1.96 x 0.6= 69.6+1.25=70.7
                                            69.6-1.25=68.43                  IC=[68.43-70.7%]

IC99%= 69.6 +- 2.58 x 0.6 = 69.6+1.65=71.25
                                                69.6-1.65= 67.9               IC= [67.9-71.25%]

PROCEDIMIENTO MUESTRAL

El procedimiento muestral es un método el cual al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese grupo posea las características de la población que estamos estudiando. La población general se elige al azar, para obtener la muestra y a partir de esta hacer inferencia de la población entera.

TAMAÑO DE LA MUESTRA

- Error estándar.
Mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar. La muestra debe ser más grande para que más pequeño sea el error.
- Variabilidad de la variable a estudiar (varianza en la población).
Tamaño de la población de estudio.
n= Z2.S2/e

En donde S2 es la varianza poblacional y e2 el error máximo aceptado.



No hay comentarios:

Publicar un comentario