INFERENCIA ESTADÍSTICA

Cuando planteamos un estudio en el ámbito sanitario para establecer relaciones entre variables, nuestro interés no suele estar exclusivamente en los pacientes concretos a los que hemos tenido acceso, sino más bien en todos los pacientes similares a estos.

Al inferir nunca tienes el dato seguro de toda la población sobre la que deduces los resultados de un estudio realizado anteriormente sobre la población que nos interesa. Al inferir siempre hay error aleatorio.

Ø Al conjunto de pacientes sobre los que queremos estudiar alguna cuestión (sacar conclusiones) le llamamos población de estudio.

Ø Al conjunto de individuos concretos que participan en el estudio le denominamos muestra.

Ø Al número de individuos de la muestra le denominamos tamaño muestral.

Ø Al conjunto de procedimientos estadísticos que permiten pasar de lo particular, la muestra, a lo general, la población, le denominamos inferencia estadística.

Ø Al conjunto de procedimientos que permiten elegir muestras de tal forma que éstas reflejen las características de la población le llamamos Técnicas de muestreo, esto se hace para evitar sesgos.

Siempre que trabajamos con muestras, aunque sean representativas, (no estudiamos el problema en toda la población sino en una parte de ella), hay que asumir un cierto error.

Ø Si la muestra se elige por un procedimiento de azar, se puede evaluar ese error. La técnica de muestreo en ese caso se denomina muestreo probabilístico o aleatorio y el error asociado a esa muestra elegida al azar se llama error aleatorio.

Ø En los muestreos no probabilísticos (Ej: estudios de conveniencia. Utilizar a los pacientes de mi hospital como muestra), no es posible evaluar el error. En los muestreos probabilísticos, el error aleatorio es inevitable pero es evaluable gracias a las leyes de la probabilidad.

Ø Cuanto mayor sea el tamaño de la muestra, favorezco la reducción del error aleatorio por probabilidad.

2. PROCESO DE LA INFERENCIA ESTADÍSTICA

El proceso por el que a partir del estimador, me aproximo al parámetro se denomina inferencia.

ERROR ESTÁNDAR.

Ø Es la medida que trata de captar la variabilidad de los valores del estimador (en este caso la media de los días de curación de la úlcera).

Ø El error estándar de cualquier estimador mide el grado de variabilidad en los valores del estimador en las distintas muestras de un determinado tamaño que pudiésemos tomar de una población.

Ø Cuanto más pequeño es el error estándar de un estimador, más nos podemos fiar del valor de una muestra concreta. Cuanto mayor sea el n el error será menor

Si en lugar de variar el valor de la media en las muestras entre 52 y 64 días, variara entre 20 y 90 días, sería menos probable que al seleccionar una muestra y calcular su media, ésta estuviera cercana a 57,46, que es el valor de la media en la población.

v CÁLCULO DEL ERROR ESTÁNDAR

TEOREMA CENTRAL DEL LÍMITE

Para estimadores que pueden ser expresados como suma de valores muestrales, la distribución de sus valores sigue una distribución normal con media de la población y desviación típica igual al error estándar del estimador de que se trate.

Si en vez de una muestra, seleccionara 100 muestras y calculara las medias y las pusiera en un histograma, tendría una distribución normal, en la cual el error estándar coincide con la desviación estándar del histograma, por lo tanto si le sumo y le resto a la media una vez la desviación estándar, es decir, el error estándar, tendré el 68.26% de las observaciones.

Por lo tanto, por así decirlo, la desviación y el error puede ser lo mismo.

Si sigue una distribución normal, sigue los principios básicos de ésta:

INTERVALOS DE CONFIANZA:

Ø Son un medio de conocer el parámetro en una población midiendo el error que tiene que ver con el azar (error aleatorio).

Ø Se trata de un par de números tales que, con un nivel de confianza determinados, podamos asegurar que el valor del parámetro es mayor o menor que ambos números.

Ø Se calcula considerando que el estimador muestral sigue una distribución normal, como establece la teoría central del límite.

Cálculo:

- Z es un valor que depende del nivel de confianza 1-α con que se quiera dar el intervalo (α=error máximo admisible: 5%). Por lo tanto Z tiene que ver con el valor que va delante de S en el teorema central del límite. Si I.C es más alto, más probabilidad de que el intervalo esté dentro y por tanto la horquilla será mayor.

- Para nivel de confianza 68% z=1 (No suele utilizarse un intervalo de confianza del 68% porque asumimos un error máximo del 5%)

- Para nivel de confianza 95% z=1,96à2.

- Para nivel de confianza 99% z=2,58à3.

- El signo significa que cuando se elija el signo negativo se conseguirá el extremo inferior del intervalo y cuando se elija el positivo se tendrá el extremo superior.

Mientras mayor sea la confianza que queramos otorgar al intervalo, éste será más amplio, es decir, el extremo inferior y el superior del intervalo estarán más distanciados y, por tanto, el intervalo será menos preciso.

Se puede calcular intervalos de confianza para cualquier parámetro: medias aritméticas, proporciones, riesgos relativos, odds ratio…

En las formulas cada vez que usamos proporcion la expresamos en la formula en tantos por 1 y no en tantos por 100 (%)

Ejemplos:

1. Se estudiaron 93 pacientes en una unidad coronaria para conocer la proporción de enfermos coronarios que presentaban algo riesgo de infarto agudo de miocardio (IAM). Tras estudiar los pacientes se observó que 22 de ellos presentaban algo riesgo de IAM. ¿Cuál sería el intervalo de confianza al 95% de la proporción de general enfermos coronarios con alto riesgo de IAM?

a) Entre el 12% y 51%.

b) Entre el 15% y el 32%.

c) Entre el 19% y el 25%.

d) Entre el 21 % y el 27%.

N=93

22 IAM

2. Se seleccionó una muestra aleatoria de 6 niños, obteniéndose las siguientes observaciones. En el primer niño: 192 calorías, el segundo 194, el tercero 184, el cuarto 186, el quinto 205 y el sexto 208. Calcúlese la estimación de la ingesta media de calorías en los escolares para una confianza del 99%.

n=6

3. En un centro de salud se pretende realizar un estudio sobre tabaquismo, para lo que se selecciona una muestra de 337 pacientes. Los enfermeros del centro de salud encontraron que en total en la muestra había 83 fumadores habituales. Se pide que calculemos el intervalo de confianza al 95 y al 99% para la proporción de tabaquismo en el total de población del centro de salud.

4. En una investigación sobre la obesidad en la población femenina adscrita en el centro de salud se obtiene un resultado sobre una muestra representativa de 233 mujeres que el peso medio de la muestra es de 69.6 kg. Y su desviación típica es de 9.8. Se pide que se calcule el intervalo de confianza de la media del peso en toda la población adulta femenina adscrita al centro de salud para un 95 y 99 % de confianza.

N:233

S: 9.8

Media: 69.6

E=s/ e=9.8/ = 0.6

IC95%= 69.6+-1.96*0.6= 69.6+1.25=70.7

69.6-1.25=68.43 IC=[68.43-70.7%]

IC99%= 69.6 +- 2.58* 0.6 = 69.6+1.65=71.25

69.6-1.65= 67.9 IC= [67.9-71.25%]

5. Un grupo de enfermera realiza un estudio para conocer la frecuencia de lesiones causados por los sistemas de extracción de sangre por vacio. Para ello una muestra de 150 pacientes se recoge datos de las lesiones ocasionadas ayándose un total de 20 pacientes con lesiones. Se pide que calcule el intervalo de confianza de la frecuencia de lesiones por extracciones por vacio, del 95 y 99%.

Por lo tanto, la cura normal es un modelo matemático basado en teorema del límite central y ley de los grandes números.

Permite comparar;

Trabajamos con una variables continuas que: sigue una distribución normal (TLC)
Y tiene más de 100 unidades (LGN)
La tipificación nos permite conocer si otro alor corresponde o no a ese distribución de frecuencia
La media coincide con lo mas alto de la campana: 8

La desviación típica es de 2 puntos

El 50 % tiene puntuaciones >8

‘’ ‘’ <8

Aproximadamente el 68% puntúa entre 8 y 10

PROCEDIMIENTO MUESTRAL. (Técnica De Muestreo).

- Un muestreo es un método tal que al escoger un grupo pequeño de una población podamos tener un grado de probabilidad de que ese pequeño grupo posea las características de la población que estamos estudiando.

- La población general de la queremos obtener conclusiones la vamos a elegir al azar (aleatoriamente), para obtener la muestra y a partir de esta hacer inferencia de la población entera à (confianza (intervalo de confianza) en %).

TIPOS DE MUESTREO.

- Probabilístico. Todos los sujetos de la población tienen una probabilidad distinta de cero en la selección de la muestra y conocida. Existe una probabilidad conocida de seleccionar a los sujetos. Por ejemplo, si vamos a seleccionar 5 sujetos de la clase, y somos un total de 50, tendré un 10 % de probabilidad de ser elegida. Sin embargo si lo hacemos a cualquier persona que pase por la calle, no sabemos a quién vamos a encontrarnos para incluir en la selección. à se puede hacer inferencia

1. Aleatorio simple. P=1/nà por azar (que azar no es ponerme en una esquina y el que pase por aquí).

2. Aleatorio sistemático.à estas tres son variaciones del muestreo aleatorio simple.

3. Estratificado.

4. Conglomerados.

- No probabilístico o de conveniencia del investigador. Puede haber personas en la población que no tengan probabilidad o que se desconozca, de ser seleccionado en la muestra. No existe probabilidad conocida, es una selección arbitraria. (“Muestreo de lo que tengo a mano”) à no se puede hacer inferencia

1. Accidental. Son aquellos en los que los sujetos de la población no tienen una probabilidad conocida o distinta de 0.

2. Por cuotas. Me pongo a pasar un cuestionario en una esquina pero el 50% a mujeres y 50% a hombres, despreciando a la mujer 51 que pasa por la esquina.

v MUESTREO PROBABILÍSTICO.

Todos y cada uno de los elementos tienen la misma probabilidad de ser elegidos para la muestra. Es el método que consiste en extraer una parte (o muestra) de una población o universo, de tal forma que todas las muestras posibles de tamaño fijo, tengan la misma posibilidad de ser seleccionados.

- Aleatorio Simple. (Es el más fiable y equitativo)

1. Se caracteriza porque cada unidad tiene la probabilidad equitativa de ser incluida en la muestra:

· De sorteo o rifa: Asignamos un nº a cada miembro de la población, calculamos el tamaño muestral y seleccionamos aleatoriamente ese nº. Este tipo de método no es fácil cuando la población es muy grande, pasando a usar el sistema que continua.

· Tabla de números aleatorios: más económico y requiere menor tiempo. Se hace cuando disponemos de una lista informatizada en una base de datos de la población de estudio.

- Aleatorio Sistemático.

1. Similar al aleatorio simple, en donde cada unidad del universo tiene la misma probabilidad de ser seleccionada.

Ejemplo: si N:500 (población) y n:100 (personas que queremos en la muestra N/n=5

5 será el intervalo para la selección de cada unidad muestral. Si tengo las personas por número seria así: saco un número aleatorio de la población y a partir de ahí cada 5 elijo al sujeto de estudio. Si saco el 320 a partir de 325, 330, 335... Hasta llegar a 100. Si termino la lista y no he llegado al 100, vuelvo a empezar de nuevo, pero siempre con el intervalo que me ha salido.

- Estratificado.

1. Se caracteriza por la subdivisión de la población de estudio en subgrupos o estratos, debido a que las variables principales que deben someterse a estudio presentan cierta variabilidad o distribución conocida que puede afectar a los resultados. Si quiero hacer un estudio sobre cifras de presión arterial, si la población de estudio el 25% son menores de 15 años, el 50% entre 15-65 años y el 25% mayor de 65. Si la muestra que necesito es de 200 personas. Seleccionare aleatoriamente siguiendo el procedimiento anterior 100 personas de entre 15-65 años, 50 menores de 15 años, y 50 mayores de 65. Se usa principalmente por motivos de edad y sexo.

- Conglomerado.

1. Se usa cuando no se dispone de una lista detallada y enumerada de cada una de las unidades que conforman el universo y resulta muy complejo elaborarla. En la selección de la muestra en lugar de escogerse cada unidad se toman los subgrupos o conjuntos de unidades conglomerados. Por ejemplo, quiero hacer un estudio de Andalucía (poblaciones amplias sobre las que se usa este método), calculo el tamaño muestral, pero si hago un muestreo aleatorio me puede salir cada sujeto en un pueblo distinto de la población andaluza, para evitarlo se seleccionan un grupo de municipios y dentro de ese municipio se hacen muestreo aleatorio simple.

2. En este tipo de muestreo el investigador no conoce la distribución de la variable.

3. Las inferencias que se hacen en una muestra conglomerada no son tan confiable como las que se obtienen en un estudio hecho por muestreo aleatorio, excluyendo directamente grandes municipios. El municipio se elige por estratificación a su vez.

Ejemplo: conglomerado de colegios en Sevilla por aleatorio sistemáticos porque elegimos al azar los colegios y estratificado es por ej elegir 30% niños de infantil y 50% de primaria.

v MUESTREO NO PROBABILÍSTICO (los de conveniencia) por ej los trabajos que estamos haciendo en etics

- No se sigue el proceso aleatorio.

- No puede considerarse que la muestra sea representativa de una población.

- Se caracteriza porque el investigador selecciona la muestra siguiendo algunos criterios identificados para los fines del estudio que realiza.

- Tipos:

1. Por cuotas: en el que el investigador selecciona la muestra considerando algunos fenómenos o variables a estudiar, como: Sexo, raza, religión, etc. (No hay aleatoriedad). Ej: coger 20% niños y 80% niñas porque en N hay 100 niños y 30 niñas.

2. Accidental: consiste en utilizar para el estudio las personas disponibles en un momento dado, según lo que interesa estudiar. De las tres es la más deficiente. Ej: coger a las personas que pasen por la esquina de cr

3. Por conveniencia o intencional. En el que el investigado, decide según sus objetivos, los elementos que integraran la muestra, considerando las unidades “típicas” de la población que se desea conocer. (En función de nuestro interés, nuestra accesibilidad…). Ej: nuestros trabajos de etics

TAMAÑO DE LA MUESTRA.

El tamaño de la muestra a tomar va a depender de

- Error estándar.

- De la mínima diferencia entre los grupos de comparación que se considera importante en los valores de la variable a estudiar. Más grande debe ser la muestra para que más pequeño sea el error.

- De la variabilidad de la variable a estudiar (varianza en la población).

- El tamaño de la población de estudio.

Calculo del tamaño de una muestra para estimar la media de una población.

n= (Z² por S²)/e²

Z es un valor que depende del nivel de confianza 1 – α con que se quiera dar a los intervalos calculados a partir de estimadores de esa muestra. (Para nivel de confianza 95%, z= 1.96; y para nivel de confianza 99% z= 2.58).

S²es la varianza poblacional.

e: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar.

- Si tras esta operación se cumple el resultado: N > n(n-1), el cálculo del tamaño muestral termina aquí.

- Si no se cumple, obtendremos el tamaño de la muestra con esta fórmula:

n´=n/1+(n/N)

Ejemplo:

1. Se desea hacer una estimación sobre la edad media de una determinada población. Calcula el tamaño de la muestra necesario para poder realizar dicha estimación con un error menor de medio año a un nivel de confianza del 99%. Se conoce de estudios previos que la edad media de dicha población tiene una desviación típica igual a 3. (35.000 habitantes).

n= Z²x S²/e²

Z= 2.58²= 6.65

S² = 3²=9

e= 0.5²= 0.25

n= 6.65x9/0.25=239.4

N > n(n-1) : 35000 > 239.4 (239.4-1)

No quedaría aquí el cálculo al ser el valor mayor Que N.

n´= 239.4/1+(239.4/35000)=238

Este resultado será el mínimo de muestra a tomar, por debajo de estar valor no nos garantizar el 99% de confianza, si cogemos menos, el intervalo de confianza puede descender.

Para calcular el tamaño de una muestra cuando queremos estimar una proporción:

P es la proporción de una categoría de la variable.

1-p: es la proporción de la otra categoría.

Z: es el valor que depende del nivel de confianza 1 - α

N: es el tamaño de la población.

e: es el error máximo aceptado por los investigadores en las diferencias entre los grupos de comparación de la variable a estudiar.

Si no se dice nada de estudios pilotos previos, se distribuyen ambos valores de p y q por igual

2. En un municipio de 2500 habitantes queremos predeterminar el tamaño de la muestra necesario para estudiar el nivel de glucemia plasmático medio de dicha población. Aceptamos un riesgo de error del 1%. Y pretendemos una precisión en la medición de glucosa plasmática del 99%. En una muestra reducida, la desviación típica calculada es de 25 mg. Calcúlese el tamaño muestral.

Z= 2,58, debido a que el error es de 1% y la precisión es de 99%.

S= 25 mg

n= (2,58²x 25²) / 5²= 59,85 = 60

Ahora, realizamos la comprobación: 60x59= 3540, por lo que n es mayor que N y no podemos quedarnos con dicha n.

n´= 60/ 1+(n/N)= 60/1+(60/2500)= 59

3. Un grupo de investigadores quieren conocer la proporción de hipertensión arterial en un municipio de 6550 habitantes, sabiendo que la bibliografía sitúa la prevalencia general de HTA en el 15%, se pide el tamaño de la muestra para estimar la prevalencia de la HTA, considerando un nivel de confianza del 95% y una precisión deseada del 3%.

N=6550

Z=1,93

P=15%, los que tienen HTA

1-p= 1-0,15= 0,85

e=3%=0.03

n = N z²_α_/2P( 1-P)/ (N-1) e² + z²_α_/2 P(1-P)= 6550x(1.96)²x0,15 (1-0,15)/(6550-1)x 0,03² + 1,96²x0,15(1-0,15)= 502,54= 503

Aquí no hace falta calcular n´ ya que estamos estimando.

4. En una población adscrita a una zona básica de salud de 25000 habitantes se quiere realizar UN ESTUDIO DE PREVALENCIA DE TABAQUISMO. En estudios pilotos previos realizados en dicha población, la prevalencia de tabaquismo se situó en el 39%. Calcular el tamaño mínimo de la muestra necesaria para este estudio considerando una confianza del 99% y un error máximo aceptado del 2,5%.

Z= 2,58

P= 39%=0,39

1-p= 1-0,30= 0,61

e= 0,025

n = N z²_α_/2P( 1-P)/ (N-1) e² + z²_α_/2 P(1-P)= 25000x 2,58²x 0,39x 0,61/ 24999x 6,25^10x-04+ 6,6564x 0,2379= 2301, 7= 2302

5. En una escuela deportiva, en el que hay matriculados 2300 alumnos se pretende conocer el valor medio de la frecuencia cardíaca basal. En un estudio piloto realizado en la escuela se conoció que la desviación típica de la frecuencia cardiaca basal es de 10 latidos/minuto. Calcular el tamaño de la muestra necesaria para realizar esta investigación, considerando un nivel de confianza del 95% y un error máximo de 5 latidos//minuto.

Z= 1,96

S=10

e=5

n= Z²x S²/e²= 1,96²x100/ 25= 15,3664= 16

N>n(n-1)// 2300>16 (15)/ 2300>240

Soy Enfermera, ¿Cuál es tu superpoder?

Páginas

TEMA 9: ESTADÍSTICA INFERENCIAL: MUESTREO Y ESTIMACIÓN