RESUMEN NUMÉRICO DE UNA SERIE ESTADÍSTICA.
Hay tres grandes tipos
de medidas estadísticas:
-
Medidas de posición: dan idea de la magnitud, tamaño o
posición de las observaciones de los datos una vez que están ordenados de menor
a mayor.
-
Medidas de tendencia central: dan idea del comportamiento central de
los sujetos.
-
Medidas de dispersión o variabilidad: dan información acerca de la heterogeneidad de los
sujetos, es decir, si son muy diferentes entre sí o no.
MEDIDAS DE TENDENCIA CENTRAL
Ejemplo:
Peso en Kg
|
fi(Frecuencia absoluta)
|
EFi(frecuencia absoluta acumulada)
|
hi(frecuencia relativa)
|
Hi (frecuencia relativa acumulada)
|
[3.3-3.8]
Mc= 3.5
|
3
|
3
|
0.075 o 7,5%
|
0.075 o 7,5 %
|
(3.8-4.3]
Mc=4.0
|
8
|
11
|
0.2 o 20%
|
0.275 o 27,5 %
|
(4,3-4.8]
Mc=4.5
|
14
|
25
|
0.35 o 35%
|
0.625 o 62,5%
|
(4.8-5.3]
Mc=5.0
|
6
|
31
|
0.15 o 15%
|
0.775 o 77.5%
|
(5.3-5.8]
Mc=5.5
|
4
|
35
|
0.1 o 10%
|
0.875 o 87,5 %
|
(5.8-6.3]
Mc=6.0
|
40
|
40
|
100%
|
1 o 100%
|
Para la
media se sumarian todos los pesos y se divide entre 40 pero con esta tabla se
haría una media aritmética ponderada, para ello se utilizaría las marcas de
clases.
X=
marca de clase x
frecuencia + marca de clase x frecuencia… / total= 3,5 +3 +4+8../40=
4,68
·
Mediana: medida de posición y central
Es el valor de la
observación tal que deja a un 50% de los datos
menor y otro 50% de los datos mayor.
-
Si
el número de observaciones es impar el
valor de la observación será justamente la observación que ocupa la posición (n+1/2)
Ejemplo: si
son 75, pues 76 entre 2 = 38, la mediana seria la edad que tiene el sujeto 38.
-
Si
el número de observaciones es par,
el valor de la mediana corresponde a la media entre los dos valores centrales,
es decir, la media entre la observación n/2 y la observación (n/2)+1. Ejemplo: cuatro
sujetos de edades, 10, 15, 20, 25, cogemos los dos sujetos centrales y hacemos
la media aritmética entre ambos.
·
Propiedad: robustez. Sólo tiene en cuenta la
posición de los valores en la muestra y por tanto tiene mucho mejor
comportamiento que la media cuando hay observaciones extremas.
·
Moda: Es el valor con mayor frecuencia
(que más veces se repite). Si hay más de una se dice que la muestra es bimodal (dos modas) o multimodal (más de dos modas). Se puede
calcular para cualquier tipo de variable tanto la cualitativa como la
cuantitativa. La moda no es el número más frecuente si no la categoría.
MEDIDAS DE POSICIÓN O CUANTILES
Se calculan para
variables cuantitativas y, al igual
que la mediana, sólo tienen en cuenta la posición
ordenado de mayor o menor de los valores en la muestra.
Los cuantiles más
usuales son los percentiles, los deciles y los cuartiles.
-
Percentiles:
o
Dividen
la muestra ordenada en 100 partes.
o
El
percentil “i” (Pi), es aquél valor que, ordenadas las observaciones
en forma creciente, el i% de ellas son menores que él y el (100-i)% restante
son mayores.
o
Para
buscar la posición de un percentil en una serie de datos agrupados, buscamos el
intervalo en el que la frecuencia relativa acumulada (Hi) sea
superior al valor del percentil.
o
El
valor del P50 corresponde al valor de la mediana.
-
Deciles:
o
Dividen
la muestra ordenada en 10 partes.
o
El
decil “i” (Di), es aquél valor que, ordenadas las observaciones en
forma creciente, el i/10% de ellas son menores que él y el (100-i)/10% restante
son mayores.
o
El
valor del D5 corresponde al valor de la mediana y, por tanto, al del
P50.
-
Cuartil:
o
Dividen
la muestra ordenada en 4 partes.
o
El
Q1, primer cuartil indica el valor que ocupa una posición en la
serie numérica de forma que el 25% de las observaciones son menores y que el
75% son mayores.
o
El
Q2, segundo cuartil indica el valor que ocupa una posición en la
serie numérica de forma que el 50% de las observaciones son menores y que el
50% son mayores. Por tanto, el Q2 coincide con el valor del D5,
con el valor de la mediana P50.
o
El
Q3, tercer cuartil indica el valor que ocupa una posición en la
serie numérica de forma que el 75% de las observaciones son menores y que el
25% son mayores.
o
El
Q4, cuarto cuartil indica el valor mayor que se alcanza en la serie
numérica.
Ejercicio de clase:
PESOS EN KG. DE NIÑOS ATENDIDOS EN LA
CONSULTA DE NIÑO SANO n = 40
3,3
|
3,3
|
3,7
|
3,9
|
3,9
|
3,9
|
4,0
|
4,1
|
4,2
|
4,2
|
4,3
|
4,3
|
4,3
|
4,3
|
4,4
|
4,4
|
4,5
|
4,5
|
4,5
|
4,5
|
4,7
|
4,7
|
4,7
|
4,7
|
4,8
|
4,8
|
4,9
|
5,0
|
5,0
|
5,1
|
5,1
|
5,3
|
5,3
|
5,4
|
5,6
|
5,8
|
5,8
|
6,0
|
6,1
|
6,1
|
-
x= 4,685
-
Mo=4´3, 4´5, 4´7.
Multimodal.
-
Me= 4,5+4,7/2=4,6. (Cuento
el número 20 y lo sumo con el siguiente).
Cuartiles:
-
Q1= 4,2
-
Q2=4,6 (el
valor de la mediana), aunque si digo que es 4,5 también está bien).
-
Q3=5,1
-
Q4=6,1
Deciles:
D1=3,9 D2=4,2 D3=4,3
Peso en Kg
|
Fi
|
Fi
|
hi
|
Hi
|
[3,25-3,75)
Mc=3,5
|
3
|
3
|
0,075
|
0,075
|
[3,75- 4,25)
Mc=4,0
|
8
|
11
|
0,2
|
0,275
|
[4,25- 4,75)
Mc=4,5
|
14
|
25
|
0,35
|
0,625
|
[4,75-5,25)
Mc=5,0
|
6
|
31
|
0,15
|
0,775
|
[5,25-5,75)
Mc=5,5
|
4
|
35
|
0,1
|
0,875
|
[5,75-6,25)
Mc=6,0
|
5
|
40
|
0,125
|
1
|
N=40
|
||||
En este
caso usaríamos las Mc para calcular las medidas de tendencia central (porque
sabemos que hay tres niños en el primer intervalo pero no sabemos cuánto pesa
exactamente cada niño).
Me=
[4,25-4,75)
Mo=
[4,25-4,75)
hi/a =
Se hace para cuando no todos tienen la misma amplitud.
a=amplitud
= 0,5 (3,75-4,25): Se haría en todos.
MEDIDAS
DE DISPERSIÓN
La
información aportada por las medidas de tendencia central es limitada.
· Rango o recorrido: Diferencia entre el mayor y el menor valor de la muestra lXn-X1l (valor absoluto).
· Desviación media: Media aritmética de las distancias de cada observación con respecto a la media de la muestra.
Para datos agrupados y según el ejemplo anterior;
·
Desviación típica o estándar: Cuantifica
el error que cometemos si representamos una muestra únicamente por su media. Esta es la que más se emplea debido a que esta
nos da un mayor rango de error.
· Varianza: Expresa la misma información en valores cuadráticos:
·
Recorrido intercuartílico: Diferencia
entre el tercer y el primer cuartil = lQ3-Q1l
·
Coeficiente de variación: Es
una medida de dispersión relativa (adimensional) ya que todas las demás se
expresan en la unidad de medida de la variable. Nos sirve para comparar la
heterogeneidad de dos series numéricas con independencia de las unidades de
medidas. Se expresa sin unidades.
-
c.v.=s/x
El C.V.
siempre va de 0 a 1.
Ejemplo
Peso en Kg
|
Fi
|
Fi
|
Hi
|
Hi
|
[3,25-3,75)
Mc=3,5
|
3
|
3
|
0,075
|
0,075
|
[3,75- 4,25)
Mc=4,0
|
8
|
11
|
0,2
|
0,275
|
[4,25- 4,75)
Mc=4,5
|
14
|
25
|
0,35
|
0,625
|
[4,75-5,25)
Mc=5,0
|
6
|
31
|
0,15
|
0,775
|
[5,25-5,75)
Mc=5,5
|
4
|
35
|
0,1
|
0,875
|
[5,75-6,25)
Mc=6,0
|
5
|
40
|
0,125
|
1
|
N=40
|
||||
Ejercicios:
1. Unas enfermeras han
registrado en el punto de vacunación las edades de nueve niños que han sido
vacunados durante una sesión, obteniéndose los siguientes datos:
3,2,4,2,1,3,5,3
y 4 meses.
Calcular:
2. En una unidad de medicina
preventiva se han realizado controles de salud a 70 trabajadores del hospital,
registrándose la siguiente distribución de pesos.
Kg
|
Nº Empleados
|
[50-60 kg)
|
8
|
[60-70 kg)
|
15
|
[70-80 kg)
|
21
|
[80-90 kg)
|
18
|
[90-100 kg)
|
7
|
[100-110 kg)
|
1
|
Completa
la tabla de frecuencias añadiendo las frecuencias relativas, frecuencias
acumuladas y marcas de clase. Elabora además una representación gráfica
adecuada a los datos registrados y calcula las siguientes medidas.
a. Media aritmética.
b. Desviación típica.
c. Coeficiente de variación.
Peso en Kg
|
Fi
|
Fi
|
Hi
|
Hi
|
[50-60)
Mc=55
|
8
|
8
|
0,114
|
0,114
|
[60-70)
Mc=65
|
15
|
23
|
0,21
|
0,324
|
[70-80)
Mc=75
|
21
|
44
|
0,3
|
0,62
|
[80-90)
Mc=85
|
18
|
62
|
0,26
|
0,88
|
[90-100)
Mc=95
|
7
|
69
|
0,1
|
0,98
|
[100-110)
Mc=105
|
1
|
70
|
0,02
|
1
|
N=40
|
||||
3.
En un centro de salud
se pretende realizar un estudio sobre las cifras de tensión arterial diastólica
en un grupo de 30 pacientes que acuden a consulta de enfermería en los programa
de atención al paciente diabético. Los enfermeros del programa midieron la TAD
de estos 30 pacientes, obteniendo las siguientes cifras (datos en mm de Hg)
45 45 45
60 60 60
65 71 74 78 80 80
80 85 85 87 87 87
87 87 87 95 95 95
95 100 100 106 109 120
a) Construye una tabla de
frecuencia.
TAD
|
Fi
|
Fi
|
Hi
|
Hi
|
[45-60)
Mc=52.5
|
3
|
3
|
0,1
|
0,1
|
[60- 75)
Mc=67,5
|
6
|
9
|
0,2
|
0,3
|
[75-90)
Mc=82,5
|
12
|
21
|
0,4
|
0,7
|
[90-105)
Mc=97,5
|
6
|
27
|
0,2
|
0,9
|
[105-120)
Mc=112,5
|
3
|
30
|
0,1
|
1
|
N=30
|
||||
Recorrido:
120- 45= 75
Intervalo: √30 =5.47 = 5 intervalos.
Amplitud:
75/5= 15
Histograma:
d)
Coeficiente de variación
Coeficiente de variación
Cv= s/x= 16,71/ 82,5= 0,20
-
El primer cuartil está en el segundo.
-
El tercer cuartil está en el cuarto
DISTRIBUCIONES NORMALES
En estadística se llama distribución normal, distribución de
Gauss o distribución gaussiana, a una de las distribuciones de probabilidad de
variable continua que con más frecuencia aparece en fenómenos reales. Es
Distribución de probabilidad más frecuente con variables continuas.
La gráfica de su
función de densidad tiene una forma acampanada y es simétrica respecto de los
valores posición central (media, mediana y moda, que coinciden en estas
distribuciones). Es simetrica dejando la mitad de los
valores por debajo del punto maximo y la mitad de los valores por encima.
Esta curva
se conoce como campana de Gauss.
Una distribución normal sigue estos principios básicos: si al valor de la media le restamos y le sumamos una desviación típica, si la serie numérica siguiera una distribución normal (como el colesterol). Dice que el 68.25% de las observaciones se va a sumar entre los valores de la suma y la resta de la media a una desviación típica. Estas datos varían si sumamos una, dos o tres desviaciones típicas.
-
S
68,26% de las observaciones.
-
2xS95,45% de las observaciones.
-
3xS 99,73% de las observaciones.
ASIMETRÍAS Y CURTOSI
·
Coeficiente de asimetría de una variable: Grado de asimetría de la distribución
de sus datos en torno a su media, cuanto más asimétrica sea, valores más
diferentes encontraremos.
·
Asimetrías:
Los resultados
pueden ser los siguientes:
-
g1=0 (distribución simétrica; existe la
misma concentración de valores a la derecha y a la izquierda de la media).
-
g1>0 (distribución asimétrica positiva;
existe mayor concentración de valores a
la derecha de la media que a su izquierda).
-
g1<0 (distribución asimétrica negativa;
existe mayor concentración de valores a la izquierda de la media que a su
derecha).
·
Curtosis
o apuntamiento de la curva.
Sirve para
medir el grado de concentración de los valores que toma en torno a su media.
Los datos se acumulan mucho, mientras más se acumulen, mas apuntada esta la
curva.
Se elige
como referencia una variable con distribución normal, de modo que para ella el
coeficiente de curtosis es 0.
Los resultados
pueden ser los siguientes:
Ejemplo:
En un estudio sobre cuidadores
principales en familias con personas dependientes, se miden las edades de los
cuidadores principales, obteniéndose la siguiente grafica:
¿A qué tipo de distribución
corresponde? Asimétrica hacia la
derecha. (ya que la cola esta hacia la derecha)
No hay comentarios:
Publicar un comentario