¡Buenos días chicos! Vamos a empezar el lunes con fuerza y aprendiendo cosas nuevas. Aquí os dejo una nueva entrada sobre las medidas de tendencia central, de posición y de dispersión. Espero que os guste y sobre todo que las entendáis.
Estas medidas se aplican únicamente a variables cuantitativas continuas. Hay tres tipos de medidas estadísticas:
- Medidas de posición: se refieren a la magnitud, tamaño o posición de los datos, estando ordenados de menor a mayor.
- Medidas de tendencia central:se refieren al comportamiento central mayoritario de los sujetos
- Medidas de dispersión o variabilidad: se refieren a la heterogeneidad de los sujetos, si son diferentes entre sí o no.
MEDIDAS DE TENDENCIA CENTRAL
- Media aritmética: es la suma de todos los valores de la variable. Se calcula para variables cuantitativas. La fórmula es: x=Σx/n
*Cuando los datos están agrupados utilizamos como valor de referencia de cada intervalo su marca de clase, y se calcula la media aritmética ponderada (sumamos la marca de clase por la frecuencia absoluta, entre N). La fórmula es: x=ΣmcFi / N *
- Mediana: medida de posición y central. Es el valor de la observación que deja a un 50% de los datos menor y otro 50% de los datos mayor.
- Si el número de observaciones es impar el valor de la observación será (n+1/2). Por ejemplo, si son 25, pues 26/2= 13
- Si el número de observaciones es par, el valor de la mediana corresponde a la media entre los dos valores centrales, la media entre la observación n/2 y la observación (n/2)+1. Por ejemplo, cuatro sujetos con edades: 10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos la media aritmética entre ambos.
- Propiedad: solo tiene en cuenta la posición de los valores en la muestra.
- Moda: el valor con mayor frecuencia. Si hay dos modas se dice bimodal, y si hay más de dos multimodal. Sirve para ambos tipos de variables. Si los datos están agrupados se habla de clase modal, y corresponde al intervalo en el que el cociente entre la frecuencia relativa y la amplitud es mayor.
MEDIDAS DE POSICIÓN O CUANTILES
Sirven para variables cuantitativas y sólo tienen en cuenta la posición ordenado de mayor a menor de los valores de la muestra.
Los cuantiles más usados son los percentiles, deciles y cuartiles, según dividan la muestra.
PERCENTILES
- Dividen la muestra en 100 partes
- El percentil "i" (Pi) es el valor que, ordenadas las observaciones en forma creciente, el i% de ellas son menores que él y el (100-i)% restante son mayores
- El valor del P50 corresponde al valor de la mediana
DECILES
- Dividen la muestra en 10 partes
- El decil "i" (Di) es el valor que, ordenadas las observaciones de forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante son mayores
- El valor D5 corresponde al valor de la mediana (P50)
CUARTIL
- Dividen la muestra en 4 partes
- Q1: valor que ocupa una posición en la serie numérica de forma que el 25% de las observaciones son menores y el 75% son mayores
- Q2: valor que ocupa una posición en la serie numérica que el 50% de las observaciones son menores y el 50% mayores. Q2 coincide con D5 y con P50
- Q3: valor que ocupa una posición en la serie numérica de forma que el 75% de las observaciones son menores y el 25% mayores
- Q4: valor mayor que se alcanza en la serie numérica
A continuación os adjunto un ejemplo explicativo con el que podréis llevar a la práctica lo aprendido hasta ahora.
PESOS
EN KG. DE NIÑOS ATENDIDOS EN LA CONSULTA n = 40
x= 4,685
Mo= 4,3; 4,5; 4,7. Multimodal
Me= 4,5+4,7/2=4,6 (cuento el número 20 y lo sumo con el siguiente)
Cuartiles
Q1= 4,2
Q2= 4,6 (el valor de la mediana)
Q3= 5,1
Q4= 6,1
Deciles:
D1= 3,9
D2= 4,2
D3= 4,3
En este caso usaríamos las
Mc para calcular las medidas de tendencia central, ya que sabemos que hay tres
niños en el primer intervalo pero no sabemos cuánto pesa exactamente cada niño.
x= ƩMcfi/n=(3,5)(3) + (4)(8) + (4,5)(14) + (5)(6) +
(5,5)(4) + (6)(5) / 40 = 4,68
Me= [4,25-4,75)
Mo= [4,25-4,75)
hi/a = Se hace para cuando no todos tienen la
misma amplitud.
a=amplitud = 0,5
(3,75-4,25): Se haría en todos.
MEDIDAS DE DISPERSIÓN
Las medidas de dispersión muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
- Rango o recorrido:Diferencia entre el mayor y el menor valor de la muestra lXn-X1l
- Desviación media: Media aritmética de las distancias de cada observación con respecto a la media de la muestra:
- Desviación típica: Cuantifica el error que cometemos si representamos una muestra únicamente por su media. Es la que más se usa
- Varianza: se expresa en valores cuadráticos
- Recorrido intercuartílico: Diferencia entre el tercer y el primer cuartil = lQ3-Q1l
- Coeficiente de variación: Es una medida de dispersión relativa (adimensional) ya que todas las demás se expresan en la unidad de medida de la variable. Nos sirve para comparar la heterogeneidad de dos series numéricas con independencia de las unidades de medidas. Se expresa sin unidades. c.v.=s/x. Siempre va de 0 a 1.
DISTRIBUCIONES NORMALES
La distribución de Gauss o distribución gaussiana es una de las distribuciones de
probabilidad de variable continua que con más frecuencia aparece en fenómenos reales. Es distribución de probabilidad más frecuente con variables continuas.
Las
distribuciones normales en un histograma aparece una especie de campana, y es simétrica
respecto de los valores posición central (media, mediana y moda, que coinciden
en estas distribuciones). Es simétrica dejando la mitad de los valores por debajo
del punto máximo y la mitad de los valores por encima.
Principios básicos:
- 1S = 68,26% de las observaciones
- 2S = 95,45% de las observaciones
- 1,95S = 95% de las observaciones
- 3S = 99,73% de las observaciones
- 2,58S = 99% de las observaciones
ASIMETRÍAS Y CURTOSIS
- Coeficiente de asimetría de una variable: Grado de asimetría de la distribución de sus datos en torno a su media, cuanto más asimétrica sea, valores más diferentes encontraremos. Es adimensional.
- Asimetrías: mientras más se acerque a 0 más simétrica es.
- g1=0 Distribución simétrica; misma concentración de valores a la derecha y a la izquierda de la media)
- g1>0 Distribución asimétrica positiva; mayor concentración de valores a la derecha de la media que a su izquierda)
- g1<0 Distribución asimétrica negativa; mayor concentración de valores a la izquierda de la media que a su derecha)
- Curtosis o apuntalamiento de la curva: sirve para medir el grado de concentración de los valores que toma en torno a su media
- g2=0 (distribución mesocúrtica o normal). Presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal)
- g2>0 (distribución leptocúrtica). Presenta un elevado grado de concentración alrededor de los valores centrales de la variable
- g2<0 (distribución platicúrtica). Presenta un reducido grado de concentración alrededor de los valores centrales de la variable
E Espero que la entrada os haya servido. Tras esto, desearos un feliz lunes aunque cuesten bastante. ¡Hasta pronto!
No hay comentarios:
Publicar un comentario