Cuando planteamos un estudio en el ámbito sanitario para
establecer relaciones entre variables, nuestro interés no suele estar
exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino
más bien en todos los pacientes similares a estos.
Al inferir nunca tienes el dato seguro de toda la población
sobre la que deduces los resultados de un estudio realizado anteriormente sobre
la población que nos interesa. Al inferir siempre hay error aleatorio.
Ø Al conjunto de pacientes sobre los
que queremos estudiar alguna cuestión (sacar conclusiones) le llamamos población de estudio.
Ø Al conjunto de individuos concretos
que participan en el estudio le denominamos muestra.
Ø Al número de individuos de la muestra
le denominamos tamaño muestral.
Ø Al conjunto de procedimientos
estadísticos que permiten pasar de lo particular, la muestra, a lo general, la
población, le denominamos inferencia
estadística.
Ø Al conjunto de procedimientos que
permiten elegir muestras de tal forma que éstas reflejen las características de
la población le llamamos Técnicas de muestreo,
esto se hace para evitar sesgos.
Siempre que trabajamos con muestras, aunque sean
representativas, (no estudiamos el problema en toda la población sino en una
parte de ella), hay que asumir un cierto error.
Ø Si la muestra se elige por un
procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en
ese caso se denomina muestreo
probabilístico o aleatorio y el error asociado a esa muestra elegida al
azar se llama error aleatorio.
Ø En los muestreos no probabilísticos
(Ej: estudios de conveniencia. Utilizar a los pacientes de mi hospital como muestra),
no es posible evaluar el error. En los muestreos probabilísticos, el error
aleatorio es inevitable pero es evaluable gracias a las leyes de la
probabilidad.
Ø Cuanto mayor sea el tamaño de la
muestra, favorezco la reducción del error aleatorio por probabilidad.
2.
PROCESO DE LA INFERENCIA ESTADÍSTICA
El proceso por el que a partir del estimador, me aproximo al
parámetro se denomina inferencia.
ERROR ESTÁNDAR.
Ø Es la medida que trata de captar la
variabilidad de los valores del estimador (en este caso la media de los días de
curación de la úlcera).
Ø El error estándar de cualquier
estimador mide el grado de variabilidad en los valores del estimador en las
distintas muestras de un determinado tamaño que pudiésemos tomar de una
población.
Ø Cuanto más pequeño es el error
estándar de un estimador, más nos podemos fiar del valor de una muestra
concreta. Cuanto mayor sea el n el error será menor
Si en lugar de variar el valor de la media en las muestras
entre 52 y 64 días, variara entre 20 y 90 días, sería menos probable que al
seleccionar una muestra y calcular su media, ésta estuviera cercana a 57,46,
que es el valor de la media en la población.
v
CÁLCULO
DEL ERROR ESTÁNDAR
Para estimadores que pueden ser expresados como suma de
valores muestrales, la distribución de sus valores sigue una distribución
normal con media de la población y desviación típica igual al error estándar
del estimador de que se trate.
Si en vez de una muestra, seleccionara 100 muestras y
calculara las medias y las pusiera en un histograma, tendría una distribución
normal, en la cual el error estándar coincide con la desviación estándar del
histograma, por lo tanto si le sumo y le resto a la media una vez la desviación
estándar, es decir, el error estándar, tendré el 68.26% de las observaciones.
Por lo tanto, por así decirlo, la desviación y el error puede
ser lo mismo.
Si sigue una distribución normal, sigue los principios
básicos de ésta:
INTERVALOS DE CONFIANZA:
Ø Son un medio de conocer el parámetro
en una población midiendo el error que tiene que ver con el azar (error
aleatorio).
Ø Se trata de un par de números tales
que, con un nivel de confianza determinados, podamos asegurar que el valor del
parámetro es mayor o menor que ambos números.
Ø Se calcula considerando que el
estimador muestral sigue una distribución normal, como establece la teoría
central del límite.
Cálculo:
-
-
Z
es un valor que depende del nivel de confianza 1-α con que se quiera dar el intervalo (α=error máximo
admisible: 5%). Por lo tanto Z tiene que ver con el valor que va delante de S
en el teorema central del límite. Si I.C es más alto, más probabilidad de que
el intervalo esté dentro y por tanto la horquilla será mayor.
-
Para
nivel de confianza 68% z=1 (No suele utilizarse un intervalo de confianza del
68% porque asumimos un error máximo del 5%)
-
Para
nivel de confianza 95% z=1,96à2.
-
Para
nivel de confianza 99% z=2,58à3.
-
El
signo
significa que cuando se elija el signo
negativo se conseguirá el extremo inferior del intervalo y cuando se elija el
positivo se tendrá el extremo superior.
Mientras mayor sea la confianza que queramos otorgar al
intervalo, éste será más amplio, es decir, el extremo inferior y el superior
del intervalo estarán más distanciados y, por tanto, el intervalo será menos
preciso.
Se puede calcular intervalos de confianza para cualquier parámetro:
medias aritméticas, proporciones, riesgos relativos, odds ratio…
Ejemplos:
1. Se estudiaron 93 pacientes en una unidad
coronaria para conocer la proporción de enfermos coronarios que presentaban
algo riesgo de infarto agudo de miocardio (IAM). Tras estudiar los pacientes se
observó que 22 de ellos presentaban algo riesgo de IAM. ¿Cuál sería el intervalo
de confianza al 95% de la proporción de general enfermos coronarios con alto riesgo
de IAM?
a)
Entre el 12% y 51%.
b)
Entre el 15% y el 32%.
c)
Entre el 19% y el 25%.
d)
Entre el 21 % y el 27%.
N=93
22 IAM
2. Se seleccionó una muestra aleatoria
de 6 niños, obteniéndose las siguientes observaciones. En el primer niño: 192
calorías, el segundo 194, el tercero 184, el cuarto 186, el quinto 205 y el
sexto 208. Calcúlese la estimación de la
ingesta media de calorías en los escolares para una confianza del 99%.
n=6
3. En un centro de salud se pretende
realizar un estudio sobre tabaquismo, para lo que se selecciona una muestra de
337 pacientes. Los enfermeros del centro de salud encontraron que en total en
la muestra había 83 fumadores habituales. Se pide que calculemos el intervalo
de confianza al 95 y al 99% para la proporción de tabaquismo en el total de
población del centro de salud.
4.
En una investigación sobre la obesidad en la población
femenina adscrita en el centro de salud se obtiene un resultado sobre una
muestra representativa de 233 mujeres que el peso medio de la muestra es de
69.6 kg. Y su desviación típica es de 9.8. Se pide que se calcule el intervalo
de confianza de la media del peso en toda la población adulta femenina adscrita
al centro de salud para un 95 y 99 % de confianza.
N:233
S: 9.8
Media: 69.6
E=s/
e=9.8/
= 0.6
IC95%= 69.6+-1.96*0.6= 69.6+1.25=70.7
69.6-1.25=68.43 IC=[68.43-70.7%]
IC99%= 69.6 +- 2.58* 0.6 = 69.6+1.65=71.25
69.6-1.65= 67.9 IC=
[67.9-71.25%]
5. Un grupo de enfermera realiza un estudio para conocer la
frecuencia de lesiones causados por los sistemas de extracción de sangre por
vacio. Para ello una muestra de 150 pacientes se recoge datos de las lesiones
ocasionadas ayándose un total de 20 pacientes con lesiones. Se pide que calcule el intervalo de confianza de la
frecuencia de lesiones por extracciones por vacio, del 95 y 99%.
Por lo tanto, la cura normal es un modelo matemático basado
en teorema del límite central y ley de los grandes números.
Permite comparar;
Trabajamos con una variables continuas que: sigue una
distribución normal (TLC)Y tiene más de 100 unidades (LGN)
La tipificación nos permite conocer si otro alor corresponde o no a ese distribución de frecuencia
La media coincide con lo mas alto de la campana: 8
La desviación típica es de 2 puntos
El 50 % tiene puntuaciones >8
‘’ ‘’ <8
Aproximadamente el 68% puntúa entre 8 y 10
-
Un
muestreo es un método tal que al escoger un grupo pequeño de una población
podamos tener un grado de probabilidad de que ese pequeño grupo posea las
características de la población que estamos estudiando.
-
La
población general de la queremos obtener conclusiones la vamos a elegir al azar
(aleatoriamente), para obtener la muestra y a partir de esta hacer inferencia
de la población entera à (confianza (intervalo de confianza) en
%).
TIPOS DE MUESTREO.
-
Probabilístico. Todos los
sujetos de la población tienen una probabilidad distinta de cero en la selección
de la muestra y conocida. Existe una probabilidad conocida de seleccionar a los
sujetos. Por ejemplo, si vamos a seleccionar 5 sujetos de la clase, y somos un
total de 50, tendré un 10 % de probabilidad de ser elegida. Sin embargo si lo
hacemos a cualquier persona que pase por la calle, no sabemos a quién vamos a
encontrarnos para incluir en la selección. à se puede hacer inferencia
1.
Aleatorio simple. P=1/nà por azar (que azar no es ponerme en una esquina y el
que pase por aquí).
2.
Aleatorio sistemático.à estas tres son variaciones del muestreo aleatorio
simple.
3.
Estratificado.
4.
Conglomerados.
-
No probabilístico o de conveniencia
del investigador. Puede
haber personas en la población que no tengan probabilidad o que se
desconozca, de ser seleccionado en la
muestra. No existe probabilidad conocida, es una selección arbitraria.
(“Muestreo de lo que tengo a mano”) à no se puede hacer inferencia
1.
Accidental. Son aquellos en los que los sujetos
de la población no tienen una probabilidad conocida o distinta de 0.
2.
Por cuotas. Me pongo a pasar un cuestionario en
una esquina pero el 50% a mujeres y 50% a hombres, despreciando a la mujer 51
que pasa por la esquina.
v
MUESTREO PROBABILÍSTICO.
Todos y cada uno de los elementos tienen la misma
probabilidad de ser elegidos para la muestra. Es el método que consiste en extraer una parte
(o muestra) de una población o universo, de tal forma que todas las muestras
posibles de tamaño fijo, tengan la misma posibilidad de ser seleccionados.
-
Aleatorio Simple. (Es el más fiable y equitativo)
1. Se caracteriza porque cada unidad
tiene la probabilidad equitativa de ser incluida en la muestra:
·
De sorteo o rifa: Asignamos un nº a cada miembro de la
población, calculamos el tamaño muestral y seleccionamos aleatoriamente ese nº.
Este tipo de método no es fácil cuando la población es muy grande, pasando a
usar el sistema que continua.
·
Tabla de números aleatorios: más económico y requiere menor
tiempo. Se hace cuando disponemos de una lista informatizada en una base de
datos de la población de estudio.
-
Aleatorio Sistemático.
1. Similar al aleatorio simple, en donde
cada unidad del universo tiene la misma probabilidad de ser seleccionada.
Ejemplo: si N:500 (población) y n:100
(personas que queremos en la muestra N/n=5
5 será el intervalo para la selección de cada unidad
muestral. Si tengo las personas por número
seria así: saco un número aleatorio de la población y a partir de ahí cada 5 elijo
al sujeto de estudio. Si saco el 320 a partir de 325, 330, 335... Hasta llegar
a 100. Si termino la lista y no he llegado al 100, vuelvo a empezar de nuevo,
pero siempre con el intervalo que me ha salido.
-
Estratificado.
1. Se caracteriza por la subdivisión de
la población de estudio en subgrupos o estratos, debido a que las variables
principales que deben someterse a estudio presentan cierta variabilidad o
distribución conocida que puede afectar a los resultados. Si quiero hacer un estudio
sobre cifras de presión arterial, si la población de estudio el 25% son menores
de 15 años, el 50% entre 15-65 años y el 25% mayor de 65. Si la muestra que
necesito es de 200 personas. Seleccionare aleatoriamente siguiendo el
procedimiento anterior 100 personas de entre 15-65 años, 50 menores de 15 años,
y 50 mayores de 65. Se usa
principalmente por motivos de edad y sexo.
-
Conglomerado.
1. Se usa cuando no se dispone de una
lista detallada y enumerada de cada una de las unidades que conforman el universo
y resulta muy complejo elaborarla. En la selección de la muestra en lugar de
escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados. Por ejemplo, quiero
hacer un estudio de Andalucía (poblaciones amplias sobre las que se usa este
método), calculo el tamaño muestral, pero si hago un muestreo aleatorio me
puede salir cada sujeto en un pueblo distinto de la población andaluza, para
evitarlo se seleccionan un grupo de municipios y dentro de ese municipio se
hacen muestreo aleatorio simple.
2. En este tipo de muestreo el
investigador no conoce la distribución de la variable.
3. Las inferencias que se hacen en una
muestra conglomerada no son tan confiable como las que se obtienen en un estudio
hecho por muestreo aleatorio, excluyendo directamente grandes municipios. El
municipio se elige por estratificación a su vez.
Ejemplo: conglomerado de colegios en Sevilla por aleatorio
sistemáticos porque elegimos al azar los
colegios y estratificado es por ej elegir 30% niños de infantil y 50% de
primaria.
v
MUESTREO NO PROBABILÍSTICO (los de conveniencia)
por ej los trabajos que estamos haciendo en etics
-
No
se sigue el proceso aleatorio.
-
No
puede considerarse que la muestra sea representativa de una población.
-
Se
caracteriza porque el investigador selecciona la muestra siguiendo algunos
criterios identificados para los fines del estudio que realiza.
-
Tipos:
1. Por cuotas: en
el que el investigador selecciona la muestra considerando algunos fenómenos o
variables a estudiar, como: Sexo, raza, religión, etc. (No hay aleatoriedad).
Ej: coger 20% niños y 80% niñas porque en N hay 100 niños y 30 niñas.
2. Accidental:
consiste en utilizar para el estudio las personas disponibles en un momento
dado, según lo que interesa estudiar. De las tres es la más deficiente. Ej:
coger a las personas que pasen por la esquina de cr
3. Por conveniencia o intencional. En el que el investigado, decide según sus objetivos, los
elementos que integraran la muestra, considerando las unidades “típicas” de la
población que se desea conocer. (En función de nuestro interés, nuestra
accesibilidad…). Ej: nuestros trabajos de etics
TAMAÑO DE LA MUESTRA.
El
tamaño de la muestra a tomar va a
depender de
-
Error
estándar.
-
De
la mínima diferencia entre los grupos de comparación que se considera
importante en los valores de la variable a estudiar. Más grande debe ser la
muestra para que más pequeño sea el error.
-
De
la variabilidad de la variable a estudiar (varianza en la población).
-
El
tamaño de la población de estudio.
Calculo
del tamaño de una muestra para estimar la media de una población.
Z es un valor que depende del nivel
de confianza 1 – α con que se quiera dar a los
intervalos calculados a partir de estimadores de esa muestra. (Para nivel de
confianza 95%, z= 1.96; y para nivel de confianza 99% z= 2.58).
S2es la varianza
poblacional.
e: es el error máximo aceptado por
los investigadores en las diferencias entre los grupos de comparación de la
variable a estudiar.
-
Si
tras esta operación se cumple el resultado: N > n(n-1), el cálculo del
tamaño muestral termina aquí.
-
Si
no se cumple, obtendremos el tamaño de la muestra con esta fórmula:
n´=n/1+(n/N)
Ejemplo:
1. Se desea hacer
una estimación sobre la edad media de una determinada población. Calcula el
tamaño de la muestra necesario para poder realizar dicha estimación con un
error menor de medio año a un nivel de confianza del 99%. Se conoce de estudios previos que la
edad media de dicha población tiene una desviación típica igual a 3. (35.000
habitantes).
n= Z2x S2/e2
Z= 2.582= 6.65
S2 = 32=9
e= 0.52= 0.25
n= 6.65x9/0.25=239.4
N > n(n-1) : 35000 > 239.4 (239.4-1)
No quedaría aquí el cálculo al ser el valor mayor Que N.
n´= 239.4/1+(239.4/35000)=238
Este resultado será el mínimo de muestra a tomar, por debajo
de estar valor no nos garantizar el 99% de confianza, si cogemos menos, el
intervalo de confianza puede descender.
Para calcular el
tamaño de una muestra cuando queremos estimar una proporción:
n=
P es la proporción de una categoría de la variable.
1-p: es la proporción de la otra categoría.
Z: es el valor que depende del nivel de confianza 1 - α
N: es el tamaño de la población.
e: es el error máximo aceptado por los investigadores en las diferencias
entre los grupos de comparación de la variable a estudiar.
Si no se dice nada de estudios pilotos
previos, se distribuyen ambos valores de p y q por igual
2. En un municipio de
2500 habitantes queremos predeterminar el tamaño de la muestra necesario para
estudiar el nivel de glucemia plasmático medio de dicha población. Aceptamos un
riesgo de error del 1%. Y pretendemos una precisión en la medición de glucosa
plasmática del 99%. En una muestra reducida, la desviación típica calculada es
de 25 mg. Calcúlese el tamaño muestral.
Z= 2,58, debido a que el error es de 1% y la precisión es de
99%.
S= 25 mg
n= (2,582 x 252) / 52=
59,85 = 60
Ahora, realizamos la comprobación: 60x59= 3540, por lo que n
es mayor que N y no podemos quedarnos con dicha n.
n´= 60/ 1+(n/N)= 60/1+(60/2500)= 59
3. Un grupo de
investigadores quieren conocer la proporción de hipertensión arterial en un
municipio de 6550 habitantes, sabiendo que la bibliografía sitúa la prevalencia
general de HTA en el 15%, se pide el tamaño de la muestra para estimar la
prevalencia de la HTA, considerando un nivel de confianza del 95% y una
precisión deseada del 3%.
N=6550
Z=1,93
P=15%, los que tienen HTA
1-p= 1-0,15= 0,85
e=3%=0.03
n = N z2α/2P( 1-P)/ (N-1) e2
+ z2α/2 P(1-P)= 6550x(1.96)2x0,15
(1-0,15)/(6550-1)x 0,032 + 1,962 x0,15(1-0,15)= 502,54=
503
Aquí no hace falta calcular n´ ya que estamos estimando.
4. En una población
adscrita a una zona básica de salud de 25000 habitantes se quiere realizar UN
ESTUDIO DE PREVALENCIA DE TABAQUISMO. En estudios pilotos previos realizados en
dicha población, la prevalencia de tabaquismo se situó en el 39%. Calcular el
tamaño mínimo de la muestra necesaria para este estudio considerando una
confianza del 99% y un error máximo aceptado del 2,5%.
Z= 2,58
P= 39%=0,39
1-p= 1-0,30= 0,61
e= 0,025
n = N z2α/2P( 1-P)/ (N-1) e2
+ z2α/2 P(1-P)= 25000x 2,582x
0,39x 0,61/ 24999x 6,2510x-04+ 6,6564x 0,2379= 2301, 7= 2302
5. En una escuela
deportiva, en el que hay matriculados 2300 alumnos se pretende conocer el valor
medio de la frecuencia cardíaca basal. En un estudio piloto realizado en la
escuela se conoció que la desviación típica de la frecuencia cardiaca basal es
de 10 latidos/minuto. Calcular el tamaño de la muestra necesaria para realizar
esta investigación, considerando un nivel de confianza del 95% y un error
máximo de 5 latidos//minuto.
Z= 1,96
S=10
e=5
n= Z2x S2/e2= 1,962x100/
25= 15,3664= 16
N>n(n-1)// 2300>16 (15)/ 2300>240
No hay comentarios:
Publicar un comentario