domingo, 12 de junio de 2016

REFLEXIÓN FINAL

Hemos llegado al final de mi blog. ¿Quién lo diría? Al comenzar el cuatrimestre no sabía de dónde iba a sacar tiempo para llevar a cabo mis entradas semanales. Al principio era un poco inexperta, me resultaba bastante complicado plasmar lo que habíamos dado en clase, sobre todo siendo escrito para que otras personas pudieran leerlo y entenderlo, pero poco a poco le coges el truco y cada vez se va haciendo más fácil el trasladar los conocimientos aprendidos al blog.

Además, creo que las entradas me han ayudado bastante a la hora de realizar el posterior estudio de la asignatura, ya que debía entender con mucha claridad los conceptos dados para que luego otras personas pudieran entender lo que había escrito. Me satisface bastante que este blog sirva de ayuda a otras personas a entender mejor la bioestadística.

Por lo que respecta a la asignatura de bioestadística, me he llevado una grata sorpresa, ya que al comenzar el cuatrimestre, no esperaba que la asignatura tuviera tanto que ver con nuestra carrera. A día de hoy puedo afirmar que es bastante necesaria, ya que la investigación es una parte esencial de la enfermería, que nos hace poder seguir mejorando y innovando cada día, ya que todo evoluciona.

Por último, pero no menos importante, me gustaría agradecer a todas aquellas personas que han dedicado su tiempo a leer mi blog, y por supuesto, a los dos profesores de la asignatura por su entrega con nosotros y sus seminarios, reforzándonos bastante los conocimientos previamente explicados en clase.

¡Esto es todo, gracias a todos y hasta pronto!

SEMINARIO V

Llegamos al último seminario de la asignatura de ETICS. En él, se llevó a cabo la exposición de los diferentes grupos. En nuestro caso, expusimos el trabajo de Etiología y calidad de vida de los pacientes con VIH/SIDA, cuyo protocolo fue incorporado a una entrada recientemente.
Considero que, todos y cada uno de ellos estaban muy bien realizados, y su trabajo nos costó.
Como era de esperar, nuestros pensamientos en relación tanto de la etiología como de la calidad de vida de estos pacientes, coincidieron con los resultados.
Para nuestro estudio, contamos con la ayuda del Hospital Virgen del Rocío de Sevilla, que nos permitió el acceso a la unidad de enfermedades infecciosas. Realizamos el estudio con 63 pacientes.
Haciendo un balance a nivel mundial, España posee el segundo índice de prevalencia más alto, en una edad comprendida entre los 15 y los 49 años, situándose la media en 36 años, siendo el 80% hombres y el 20% mujeres.
Dentro de nuestros 63 pacientes, había distintas vías de transmisión del virus del VIH: transmisión sexual (homosexual) 42%; transmisión sexual (heterosexual) 34,5%; parenteral 8,1%. La más elevada, como podemos observar es por transmisión sexual. Por otro lado, debemos recalcar que las cifras de personas contagiadas por vía parenteral han descendido considerablemente. Esto se debe a que, en la década de los 90 era bastante alto el consumo de drogas, de ahí que los pacientes se contagiaran por el uso de jeringuillas.
Por otro lado, y para conocer nuestro segundo objetivo, que era conocer la calidad de vida de estos pacientes, hicimos una serie de preguntas sobre su vida tanto personal como social, en la que debían responder con una serie de números (del 1 al 5). En los resultados obtenidos pudimos comprobar que, el 50% de los pacientes afirmaba que el tratamiento no era un impedimento para su vida, seguido de un 19,35% que responden que casi nunca lo ha sido, sumando un 79,35%. Además, el 49,21% nunca ha padecido efectos secundarios por el tratamiento. Todo esto nos lleva a obtener unos resultados bastante buenos. La población está cada vez más concienciada con la enfermedad del  SIDA. Además, el tratamiento actualmente está costeado por la Seguridad Social, y como hemos podido observar, no es impedimento para estas personas para llevar a cabo su vida normal.
Cada vez más personas tienen conocimiento de esta enfermedad, y entienden que no hay peligro de contagio si dicha enfermedad está controlada.

jueves, 9 de junio de 2016

TEMA 10: HIPÓTESIS ESTADÍSTICAS. TEST DE HIPÓTESIS

CONTRASTES DE HIPÓTESIS

Sirven para controlar los errores aleatorios, además de para responder a preguntas de investigación. La estrategia es la siguiente:
  • Establecer una hipótesis cerca del valor del parámetro
  • Realizar recogida de datos
  • Analizar coherencia entre hipótesis previa y datos obtenidos
  1. Test de Kolmogorov-Smirnov: se utiliza si el tamaño muestral es superior a 50
  2. Test de Shapiro-Wilks: se utiliza si el tamaño muestral es inferior a 50
  • Tipología de variables que participan en hipótesis nula
  • Número de categorías de las variables cualitativas que participan en hipótesis nula
  • Normalidad (o no) de la distribución de las variables cuantitativas
  • Usamos el test de Anova cuando queremos comparar tres o más variables. 
  • Tenemos un valor P que procede de F. Si el valor de F es menor que 0,05 rechazamos la hipótesis nula, si es mayor, la aceptamos (anteriormente explicado).
  • La hipótesis nula (H0) establece que todas las medias son iguales, en cambio la alternativa (Ha) establece que no todas las medias son iguales.
  • Todos los grupos siguen una distribución normal, por lo que tendríamos que hacer pruebas de normalidad (Shapiro o Kolmogorov, dependiendo si el número de sujetos es menor o mayor de 50). 
Para comprender las hipótesis, debemos entender los siguientes conceptos:
  • n= nº de individuos totales
  • i= nº de grupos
  • x= media
  • ni= nº de individuos en el grupo
  • xij= valor de cada individuo dentro del grupo
  • xi= media de cada grupo
NORMALIDAD

Dos pruebas. Ambos son tests no paramétricos: 
Tipos de análisis estadísticos según el tipo de variables implicadas en el estudio:

A la hora de elegir un test debemos tener en cuenta los siguientes aspectos:

Utilizamos Pearson cuando las dos variables (dependiente e independiente) son normales

Utilizamos Spearman cuando una de las dos variables no sigue las distribuciones normales

ERRORES DE HIPÓTESIS

El test de hipótesis mide la probabilidad de error que se comete si se rechaza la hipótesis nula.
Con una misma muestra podemos aceptar o rechazar la hipótesis nula. Todo depende del error α, que es la probabilidad de equivocarnos al rechazar la hipótesis nula.
Rechazamos H0 para un nivel α máximo del 5% (p< 0.05). Por encima del 5% de error, aceptamos la hipótesis nula. Por debajo de 0,05 rechazamos la hipótesis nula. Es lo que llamamos significación estadística.

Si p=0,00028 rechazo la hipótesis nula(H0)

Si p=0,16 acepto la hipótesis nula(H0)


TIPOS DE ERRORES EN TEST DE HIPÓTESIS
  1. Error de tipo alfa (α): se produce al rechazar la hipótesis nula, cuando ésta es cierta. Aceptamos que podemos equivocarnos hasta un 5%. También llamado falso positivo. Es el más importante.
  2. Error de tipo beta (β): se produce cuando aceptamos la hipótesis nula, siendo ésta falsa. También llamada falso negativo.

TEST CHI-CUADRADO

Esta parte de la teoría la vamos a realizar más práctica, para que sea más interactiva y no todo sea explicación.
Lo aplicamos cuando queremos comparar variables cualitativas (dependiente e independiente). Si al finalizar el estudio nos damos cuenta de que ambas variables no tienen relación entre sí podemos decir que son independientes.
Una vez obtenido el valor de chi-cuadrado, nos vamos a la tabla de distribución.
Grado de libertad (gdl)= (nºcolumnas-1) x (nº filas-1)

Para que os sea más fácil, os adjunto un vídeo explicativo perteneciente a la Universidad de Salamanca. ¡Espero que os sirva!



TEST DE ANOVA

Para hacer ANOVA necesitamos saber que:
Anova calcula:
- Variabilidad entre grupos= (xi-x)2
- Variabilidad dentro de grupos= (xij-xi)2
F= entre los grupos/dentro  de  grupos

Al rechazar la hipótesis nula afirmamos que hay diferencias entre las medias de los grupos, y que éstas son significativas.

TEST DE STUDENT

En un estudio de embarazadas en un centro de  salud cercano a dos asentamientos chabolistas se pretende saber si existen diferencias entre los dos asentamientos en las edades de embarazo en las mujeres que iniciaron la gestación en el último trimestre. Para ello se toman datos de las gestantes:


Determina si existen diferencias significativas en  las edades medias de las gestantes en los dos asentamientos. Asumiendo que la edad en ambos sigue una distribución normal.


Con esta entrada terminamos los temas teóricos de la asignatura, espero que os hayan gustado, y sobre todo, ¡que os hayan servido de ayuda!

TEMA 9: ESTADÍSTICA INFERENCIAL. MUESTREO Y ESTIMACIÓN

INFERENCIA ESTADÍSTICA
Al plantear un estudio en el ámbito sanitario, debemos mostrar interés en todos los pacientes similares a los que vamos a estudiar. A esto se denomina como inferir. Podemos definir distintos conceptos:
  • Población de estudio: conjunto de pacientes sobre los que queremos estudiar alguna cuestión
  • Muestra: conjunto de individuos concretos que participan en el estudio
  • Tamaño muestral: número de individuos de la muestra
  • Interferencia estadística: conjunto de procedimientos estadísticos que permiten pasar de lo particular (muestra) a lo general (población) 
  • Técnicas de muestreo: conjunto de procedimientos que permiten elegir muestras de tal forma que reflejen las características de la población 
  • Si la muestra se elige al azar, el error se evalúa mediante muestreo probabilístico o aleatorio, y el error se llama error aleatorio.
  • En los muestreos no  probabilísticos no se puede evaluar el error. 
  • Cuanto mayor sea el tamaño de la muestra, favorezco la reducción del error aleatorio por probabilidad.
  1. Para una media: es la desviación estándar de la estimación promedio de muestra de una media de la población. La calculadora de Error estándar utiliza la fórmula para calcular que el error estándar de la media es :
  1. Para una proporción: mientras mayor sea el tamaño de una muestra, menor será el error estándar.
TEOREMA CENTRAL DEL LÍMITE:
  • Probabilístico: todos los sujetos tienen probabilidad de ser seleccionados
  1. Aleatorio simple
  • De rifa: le ponemos un número a cada miembro de la población, calculamos el tamaño muestral y seleccionamos aleatoriamente el número. Cuando la población es muy grande usamos el aleatorio sistemático.
  • Tabla de números aleatorios: si disponemos de una lista de la población deestudio en una base de datos. Más económico y en menos tiempo
    2. Aleatorio sistemático: similar al aleatorio simple pero para poblaciones más grandes.

   3. Estratificado: se produce una subdivisión en subgrupos, debido a que las variables presentan una distribución que puede afectar a los resultados.
    
   4. Conglomerados: si no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman la población y resulta difícil elaborarla. En la elección de la muestra se cogen subgrupos. El investigador no conoce la distribución de la variable.

  • No probabilístico/de conveniencia para el investigador: hay personas que no tienen probabilidad de ser seleccionados, y no se realiza de forma aleatoria, las muestras las ellige el investigador.
  1. Accidental: se utilizan las personas disponibles en un momento dado
  2. Por cuotas: un % a un grupo y otro % a otro grupo
  3. Por conveniencia: el investigador selecciona las muestras dependiendo de sus objetivos

TAMAÑO DE LA MUESTRA

El tamaño de la muestra depende de:
  • Si se cumple el resultado: N > n(n-1), el cálculo del tamaño muestral termina aquí.
  • Si no se cumple, obtendremos el tamaño de la muestra con esta fórmula: n´=n/1+(n/N)
PROCESO DE LA INFERENCIA ESTADÍSTICA

Tenemos una población de estudio, y la medida que queremos obtener se denomina parámetro.
Hacemos una selección aleatoria y obtenemos una muestra. La medida de la variable de estudio obtenida en dicha muestra se denomina estimador.
Al proceso por el que,a partir del estimador me aproximo al parámetro se denomina inferencia.

A continuación, os adjunto un ejemplo práctico:

Estudio tiempos de curación de úlceras en muestra de 100 pacientes.
-            Media del tiempo muestra 1=53,77 días.
-            Media del tiempo muestra 2=57,08 días.

Construimos un histograma con los estimadores de la media de tratamiento calculados en 200 muestras (200 estudios distintos, y de todos calculamos la media) distintas de 100 pacientes cada una. El histograma es una campana de Gauss, por lo tanto seguiría una distribución normal. Esto significa que utilizando los principios que siguen las distribuciones normales puedo hacer inferencias. 
Siempre saldría así debido a que tendría una distribución normal. Esto nos permite calcular el error estándar. Que es el error que asumimos cuando seleccionamos una muestra probabilística. La variabilidad de los estimadores anteriores se conoce como error estándar.


ERROR ESTÁNDAR

Es la medida que trata de captar la variabilidad de los valores del estimador. Mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.  Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta. 

CÁLCULO
Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador de que se trate.

Si en vez de una muestra, se seleccionara 100 muestras y calculara las medias y las pusiera en un histograma, tendría una distribución normal, en la que el error estándar coincide con la desviación estándar del histograma, por lo que si le sumo y le resto a la media una vez la desviación estándar (error estándar), tendré el 68.26% de las observaciones. 

INTERVALOS DE CONFIANZA

Son un medio de conocer el parámetro en una población midiendo el error aleatorio. Son un par de números con los que  podemos asegurar que el valor del parámetro es mayor o menor que ambos números. 

Cálculo:

Z: depende del nivel de confianza 1-α con que se quiera dar el intervalo (α=error máximo admisible, 5%). 
- Para nivel de confianza 95%     Z=1,96.
- Para nivel de confianza 99%     Z=2,58.
- Cuando se elija el signo negativo se conseguirá el extremo inferior del intervalo y cuando se elija el positivo se tendrá el extremo superior

A continuación os adjunto un ejemplo:
En una investigación sobre la obesidad en la población femenina adscrita en el centro de salud se obtiene un resultado sobre una muestra representativa que el peso medio de la muestra es de 69.6 kg. Y su desviación típica es de 9.8. se pide que se calcule el intervalo de confianza de la media del peso en toda la población adulta femenina adscrita al centro de salud para un 95 y 99 % de confianza.
N:233
S: 9.8
Media: 69.6
E=s/√n   e=9.8/√233 = 0.6     
IC95%= 69.6+-1.96 x 0.6= 69.6+1.25=70.7
                                            69.6-1.25=68.43                  IC=[68.43-70.7%]

IC99%= 69.6 +- 2.58 x 0.6 = 69.6+1.65=71.25
                                                69.6-1.65= 67.9               IC= [67.9-71.25%]

PROCEDIMIENTO MUESTRAL

El procedimiento muestral es un método el cual al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese grupo posea las características de la población que estamos estudiando. La población general se elige al azar, para obtener la muestra y a partir de esta hacer inferencia de la población entera.

TAMAÑO DE LA MUESTRA

- Error estándar.
Mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar. La muestra debe ser más grande para que más pequeño sea el error.
- Variabilidad de la variable a estudiar (varianza en la población).
Tamaño de la población de estudio.
n= Z2.S2/e

En donde S2 es la varianza poblacional y e2 el error máximo aceptado.



lunes, 6 de junio de 2016

SEMINARIO IV

Este cuarto seminario de la asignatura se dedicó a repasar los temas previamente explicados en clase, así como a la resolución de dudas surgidas con los respectivos temas. 
Además, nos explicaron las últimas pautas necesarias para finalizar nuestro proyecto de investigación, así como la fecha para la exposición del mismo. 
En resumen, este seminario nos sirvió para afianzar conocimientos y para repasar conceptos previos al examen, por lo que nos sirvió de bastante ayuda. ¡Espero que el examen nos salga bien, ya os informaré!


domingo, 5 de junio de 2016

TEMA 8: MEDIDAS DE TENDENCIA CENTRAL, POSICIÓN Y DISPERSIÓN

¡Buenos días chicos! Vamos a empezar el lunes con fuerza y aprendiendo cosas nuevas. Aquí os dejo una nueva entrada sobre las medidas de tendencia central, de posición y de dispersión. Espero que os guste y sobre todo que las entendáis.

Estas medidas se aplican  únicamente a variables cuantitativas continuas. Hay tres tipos de medidas estadísticas:
  1. Medidas de posición: se refieren a la magnitud, tamaño o posición de los datos, estando ordenados de menor a mayor.
  2. Medidas de tendencia central:se refieren al comportamiento central mayoritario de los sujetos
  3. Medidas de dispersión o variabilidad: se refieren  a la heterogeneidad de los sujetos, si son diferentes entre sí o no.
MEDIDAS DE TENDENCIA CENTRAL
  • Media aritmética: es la suma de todos los valores de la variable. Se calcula para variables cuantitativas. La fórmula es: x=Σx/n 
*Cuando los datos están agrupados utilizamos como valor de referencia de cada intervalo su marca de clase, y se calcula la media aritmética ponderada (sumamos la marca de clase por la frecuencia absoluta, entre N). La fórmula es: x=ΣmcFi / N *
  • Mediana: medida de posición y central. Es el valor de la observación que deja a un 50% de los datos menor y otro 50% de los datos mayor.
  1. Si el número de observaciones es impar el valor de la  observación será  (n+1/2). Por ejemplo, si son 25, pues 26/2= 13
  2. Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, la media entre la observación n/2 y la observación (n/2)+1. Por ejemplo, cuatro sujetos con edades: 10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos la media aritmética entre ambos.
  • Propiedad: solo tiene en cuenta la posición de los valores en la muestra.
  • Moda: el valor con mayor frecuencia. Si hay dos modas se dice bimodal, y si hay más de dos multimodal. Sirve para ambos tipos de variables. Si los datos están agrupados se habla de clase  modal, y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor.
MEDIDAS DE POSICIÓN O CUANTILES

Sirven para variables cuantitativas y sólo tienen en cuenta la posición ordenado de mayor a menor de los valores de la muestra. 
Los cuantiles más usados son los percentiles, deciles y cuartiles, según dividan la muestra.

PERCENTILES
  • Dividen la muestra en 100 partes
  • El percentil "i" (Pi) es el valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores
  • El valor del P50 corresponde al valor de la mediana
DECILES
  • Dividen la muestra en 10 partes
  • El decil  "i" (Di) es el valor que, ordenadas las observaciones de forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores
  • El valor D5 corresponde al valor de la mediana (P50)
CUARTIL
  • Dividen la muestra en 4 partes
  • Q1: valor que ocupa una posición en la serie numérica de forma que el 25% de las observaciones son menores y el 75% son mayores
  • Q2: valor que ocupa una posición en la serie numérica que el 50% de las observaciones son menores y el 50% mayores. Q2 coincide con D5 y con P50
  • Q3: valor que ocupa una posición en la serie numérica de forma que el 75% de las observaciones son menores y el 25% mayores
  • Q4: valor mayor que se alcanza en la serie numérica
A continuación os adjunto un ejemplo explicativo con el que podréis llevar a la práctica lo aprendido hasta ahora.

PESOS EN KG. DE NIÑOS ATENDIDOS EN LA CONSULTA   n = 40


x= 4,685
Mo= 4,3; 4,5; 4,7. Multimodal
Me= 4,5+4,7/2=4,6 (cuento el número 20 y lo sumo con el siguiente)

Cuartiles
Q1= 4,2
Q2= 4,6 (el valor de la mediana)
Q3= 5,1
Q4= 6,1

Deciles:
D1= 3,9
D2= 4,2
D3= 4,3

En este caso usaríamos las Mc para calcular las medidas de tendencia central, ya que sabemos que hay tres niños en el primer intervalo pero no sabemos cuánto pesa exactamente cada niño.
x= ƩMcfi/n=(3,5)(3) + (4)(8) + (4,5)(14) + (5)(6) + (5,5)(4) + (6)(5) / 40 = 4,68
Me= [4,25-4,75)
Mo= [4,25-4,75)
hi/a = Se hace para cuando no todos tienen la misma amplitud.
a=amplitud = 0,5 (3,75-4,25): Se haría en todos.

MEDIDAS DE DISPERSIÓN

Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
  • Rango o recorrido:Diferencia entre el mayor y el menor valor de la muestra lXn-X1l
  • Desviación media: Media aritmética de las distancias de cada observación con respecto a la media de la muestra: 
  • Desviación típica: Cuantifica el error que cometemos si representamos una muestra únicamente por su media. Es la que más se usa
  • Varianza: se expresa en valores cuadráticos
  • Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil = lQ3-Q1l
  • Coeficiente de variación: Es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas. Se expresa sin unidades.  c.v.=s/x. Siempre va de 0 a 1.
 DISTRIBUCIONES NORMALES
La distribución de Gauss o distribución gaussiana es una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. Es distribución de probabilidad más frecuente con variables continuas.
Las distribuciones normales en un histograma aparece una especie de campanay es simétrica respecto de los valores posición central (media, mediana y moda, que coinciden en estas distribuciones). Es simétrica dejando la mitad de los valores por debajo del punto máximo y la mitad de los valores por encima.

Principios básicos:
  • 1S = 68,26% de las observaciones
  • 2S = 95,45% de las observaciones
  • 1,95S = 95% de las observaciones
  • 3S = 99,73% de las observaciones
  • 2,58S = 99% de las observaciones
ASIMETRÍAS Y CURTOSIS
  • Coeficiente de asimetría de una variableGrado de asimetría de la distribución de sus datos en torno a su media, cuanto más asimétrica sea, valores más diferentes encontraremos. Es adimensional.
  • Asimetrías: mientras más se acerque a 0 más simétrica es.

  1.    g1=0 Distribución simétrica; misma concentración de valores a la derecha y a la izquierda de la media)
  2.     g1>0 Distribución asimétrica positiva; mayor concentración de valores a la derecha de la media que a su izquierda)
  3.      g1<0 Distribución asimétrica negativa; mayor concentración de valores a la izquierda de la media que a su derecha)



  •      Curtosis o apuntalamiento de la curva: sirve para medir el grado de concentración de los valores que toma en torno a su media
  1.      g2=0 (distribución mesocúrtica o normal). Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal)
  2.   g2>0 (distribución leptocúrtica). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable
  3.   g2<0 (distribución platicúrtica). Presenta un reducido grado de concentración alrededor de los valores centrales de la variable



E     Espero que la entrada os haya servido. Tras esto, desearos un feliz lunes aunque cuesten bastante. ¡Hasta  pronto!