XIII Curso de Experto Universitario en Epidemiología y Nuevas Tecnologías Aplicadas.

José Ignacio Vitón Asenjo


PLAN DE ANÁLISIS, Y ETAPAS.

El análisis estadístico será el de un estudio de casos y controles que se corresponde al análisis de datos binarios (dicotómicos): la variable dependiente (caso o control) se estudia en función de una serie de variables independientes (exposiciones de interés, factores de confusión y modificadores de efecto). Por tanto se han desarrollado el análisis y la presentación de los resultados según el siguiente esquema:
Descripción de la población base. Comparación de las variables demográficas, exposiciones y otras variables entre casos y controles. (uso de procedimientos estadísticos simples (t de Student, X2). Selección de población Control.
Estudio de la asociación entre la variable de exposición principal y las otras variables en el grupo control (que representa a la población de la que proceden los casos) utilizando técnicas de regresión lineal, correlación o tablas de contingencia). Este análisis permite identificar potenciales factores de confusión que deberán ser tenidos en cuenta en análisis posteriores.
Análisis simple de base poblacional anidado de diseño tipo acumulativo y cohorte fija. H0 y H1, OR, EE, IC, p, X2.
Análisis estratificado de la asociación entre el desarrollo de la enfermedad y la variable de exposición principal (análisis de tablas de contingencia).
Análisis multivariante de la asociación entre el desarrollo de la enfermedad y la variable de exposición principal (regresión logística en estudios de casos y controles no emparejados y regresión logística condicional en estudios de casos y controles emparejados).

----------------------------------------------------------------------

3.1 Análisis exploratorio.
Comente las principales incidencias observadas en los datos.

Desconocemos:

El factor componente de la enfermedad
No conocemos el tiempo de seguimiento por individuo.
No sabemos si los casos han recibido tratamiento y por cuánto tiempo.
No hay proporciones equilibradas en la muestra en cuanto a ciertas variables como el hábitat, acceso al agua potable o la provincia de residencia.
 

3.2 Análisis descriptivo.

Como población base partimos de una cohorte teórica de 250 individuos de la que se toman tanto los casos como los controles.

El objetivo de este análisis descriptivo será analizar las variables de que disponemos y si es necesario establecer criterios de selección (inclusión/ exclusión) en ambos grupos.

En términos generales, la muestra de la que tenemos datos, es una población bastante equilibrada en cuanto a los valores que toman las variables en los grupos de casos y controles. Sin embargo es necesario estudiar cada una de las variables para asegurar que la selección de ambos grupos es lo más precisa posible y así evitar sesgos de selección.

1. EDAD
La población estudiada está entre los 15 y los 24 años, con la mitad de ambos sexos aproximadamente y un perfil de distribución por edades similar.

Por otro lado, podemos ver que, aunque en números absolutos la población enferma es menor que la sana, el perfil de distribución etaria entre el grupo de sanos y el grupo de enfermos también es comparable.

La muestra con 15 años tiene un 70% con enfermedad. Aunque esta cifra no es muy significativa pues el número de individuos de 15 años es muy bajo, por lo que pequeños cambios en las cifras provocan un gran cambio en los porcentajes.


Con el objeto de analizar la enfermedad de manera más equilibrada, se estratifica la población en dos grupos etarios con el número de individuos más comparable:


En cuanto a la profilaxis, hay más población que ha recibido la profilaxis frente a la que no la ha recibido. Las edades que más profilaxis han recibido están entre los 16 y los 21 años. Al agrupar en dos intervalos estas diferencias no se producen.

Por otro lado las edades señalas de entre 16 y 21 años, coinciden con las edades en que la población tiene mejor nivel socioeconómico, el reparto de hábitat es menos centralizado en el rural, y tienen mayor acceso al agua potable. Al estratificar observamos que los porcentajes en ambos grupos siguen una misma tendencia tanto en tipo de hábitat como en acceso al agua potable. Cabría destacar que el nivel de riqueza es algo mayor en el grupo de (19-24) lo cual no sorprende pues podría corresponder a individuos con trabajo.

 

2. SEXO

La distribución por sexo es aproximadamente un 50% en ambos tipos de poblaciones casos y controles, algo menos igualado en la población enferma con un 51,7% hombres frente a un 48,3% de mujeres.

Ocurre con la profilaxis un 48,6% de hombres y un 51,4% de mujeres la han recibido.

3. HÁBITAT Y PROVINCIA

Ya hemos visto la distribución por edad en nuestra población muestra. Sin embargo también podemos analizar las 4 provincias desde el punto de vista de la distribución por hábitats. A primera vista, en el gráfico de abajo puede observarse que la distribución es similar entre lo urbano y lo rural, en la que prima siempre el hábitat rural.

Para comparar las proporciones de enfermedad por provincia vamos estandarizar, pues no disponemos del mismo número de individuos en nuestra muestra de 250 para cada una de las provincias.

Para ello, tomamos como población modelo, la totalidad de la muestra de 250 individuos y sus prevalencias de enfermedad por cada estrato de edad.

Se aplica la estandarización indirecta que nos permite saber la proporción de enfermos en las distintas provincias si se les aplicaran las tasas de la población de referencia (250 individuos):

Una vez estandarizados las diferencias se suavizan muy poco. La distribución de enfermos por provincia puede suponer un sesgo de selección, pues la muestra de 250 se reparte de forma no homogénea en lo que a enfermos se refiere. Si se hace la prueba de X2 para enfermedad y profilaxis por provincia:
Ho= “Las variables son independientes.”
Nivel de significancia: 95%.
Grados de libertad = (4 filas – 1) x (2 columnas -1) = 3
Valor crítico = 7,8147.
Si X2 = Valor crítico ->Se acepta la hipótesis nula.
Si se supera el valor crítico se entendería que hay asociación, por lo que se descarta el posible sesgo por provincia de residencia.

La probabilidad que aparece en los gráficos se traduce en la probabilidad de que al rechazar la hipótesis nula se cometa un error (es el valor p). En los casos anteriores p es bastante alto, y la hipótesis nula no es rechazada.

La misma prueba de X2 se realiza para el Hábitat:

Para enfermedad, la Chi-cuadrado aunque queda bastante cerca no supera el valor crítico y la p es muy baja pero sigue siendo mayor a 0,05 que es el valor de significancia estadística pre-seleccionado para este estudio.
Para la profilaxis se puede concluir que existe asociación, por lo que habrá que tener en cuenta esto para evitar posibles sesgos. Vemos que p es muy bajo o nulo, por lo que no cometemos apenas error si rechamos la hipótesis nula.

4. NIVEL SOCIOECONÓMICO

En relación al nivel socioeconómico de la muestra, son mayoritarios los individuos con ingresos medios-bajos y bajos. Esta distribución es equiparable en las 4 provincias.

La provincia 4 tiene el porcentaje más alto de población con niveles socioeconómicos medio-alto y alto, y destaca también por tener el porcentaje más bajo de población en estratos más pobres.

Además la provincia 4 es la que mayor proporción dentro de sus habitantes tiene en medio urbano.

Los estratos económicos altos, tienen entre un 64 -67 % de la población sin enfermedad, esta cifra desciende hasta el 45% aproximadamente en los dos estratos más pobres.
Parece lógico pues, que desde el punto de vista de la profilaxis, ocurra lo mismo. Y así es, los niveles socioeconómicos más altos tienen entre un 85 y un 95% de profilaxis, mientras que los estratos más bajos no llegan al 40%.

La prueba de X2 confirma esta teoría:

Existe asociación entre el nivel socioeconómico y la enfermedad, pero esta asociación es más fuerte aún con la profilaxis. .


5. ESTADO NUTRICIONAL

El estado nutricional de nuestra población es muy equilibrado pues ronda entre el índice de masa corporal normal y la obesidad de 1er grado. Es por tanto una variable que aunque aparezca a priori como continua, se podría dicotomizar.

Las poblaciones enferma y sana, tienen un perfil en cuanto a estos estados nutricionales bastante similar, siendo mayoría de peso Normal.

El OR es de 1,16 y su intervalo de confianza (95%) es de 0,70 a 1,93. Incluye la unidad por lo que podemos afirmar que no hay asociación entre ambas variables.

Desde el punto de vista de la profilaxis, en términos absolutos reciben más profilaxis los individuos con obesidad de 1er grado.

Vemos que OR = 1,73, IC: 1,03 – 2,91 no engloba la unidad, por lo que podría haber una asociación pero muy débil.
Si observamos X2, vemos que ésta supera el valor crítico establecido para 1 grado de libertad y 95% de confianza (3,8415), así pues confirma la asociación. Además el valor de p < 0,05 nos indica que podemos rechazar la hipótesis nula con baja probabilidad de equivocarnos.


6. AGUA POTABLE

El único hábitat donde puede encontrarse agua no potable es el medio rural.

Un 58% de la población total de la muestra con menor nivel económico no tiene acceso al agua potable. Lo mismo ocurre con la siguiente en el escalafón socioeconómico alcanzándose hasta un 39% sin agua potable.

Observando las frecuencias en valores absolutos inicialmente puede verse que en la población enferma hay mayor proporción de individuos sin acceso a agua potable.

En una tabla 2x2 en la que el acceso al agua potable sea la exposición, vemos que el OR = 0,451 (0,262 – 0,774), es decir es un valor de asociación aceptable, que al estar por debajo de la unidad relacionaría el acceso al agua potable como un factor de protección. Además la X2 M-H = 8,463 está por encima del valor crítico para 1 grado de libertad y 95% de confianza (3,8415) y tiene una p muy baja, lo que confirma dicha asociación.

Sin embargo no tiene porque estar relacionado con la profilaxis en estudio, el hecho de tener agua potable ya es un factor de protección en sí.

 

7. ANTECEDENTES

Del total de la muestra de casos y controles que estamos estudiando (250 individuos) un 63,3 % de los individuos han recibido algún tipo de profilaxis.

En el grupo de casos no se observa diferencia significativa entre el hecho de tener antecedentes o no. Sin embargo en el grupo de controles destaca que tres cuartas partes de los individuos que la forman, tienen antecedentes familiares de la enfermedad. Por algún motivo, el tener antecedentes puede aumentar la probabilidad de estar sano.

Esto a priori podría explicarse diciendo que existe algún tipo de herencia genética que favorece la acción de la profilaxis o es la profilaxis en sí misma. También puede explicarse si los familiares que han pasado la enfermedad han procurado más intensamente que los descendientes reciban algún tipo de profilaxis, o que la profilaxis se aplica prioritariamente a la población de mayor riesgo, en este caso familias con antecedentes.

Si se analizan las frecuencias de la profilaxis frente a los antecedentes, efectivamente observamos que el 88% de la población con antecedentes ha recibido algún tipo de profilaxis.
Y ningún individuo sin antecedentes ha recibido profilaxis.

Analizando las cifras de enfermos en relación a los antecedentes obtenemos un Odds Ratio por debajo de la unidad lo que significa que el hecho de tener antecedentes es un factor de protección. (OR = 0,297; IC: 0,173 – 0,509). La prueba de X2 nos indica que las variables están efectivamente asociadas. La pregunta en este caso sería ¿por qué entonces, han recibido profilaxis?


8. RETRASO EN EL TRATAMIENTO

En nuestra muestra poblacional, un 52,5% de la población enferma ha sufrido retraso en el tratamiento. Esto demuestra, como se ha visto antes, que las medidas de prevención y detección de la enfermedad no son demasiado eficaces.

En cuanto a la profilaxis, ningún individuo que la haya recibido ha sufrido retraso en el tratamiento. Esto se explicaría porque cuando se somete a alguien a un tratamiento profiláctico la vigilancia de aparición de la enfermedad es mayor y por tanto el inicio del tratamiento en caso de enfermar, es inmediato.
Sin embargo de entre aquellos que no estaban bajo profilaxis, hay hasta 23 un 56% que sufrieron retraso en el tratamiento.

 

Si continuamos analizando esta variable en relación con las variables ya estudiadas, vemos lo siguiente:

• Aquellos que tienen antecedentes no han tenido retraso en el tratamiento salvo un 3,45%, lo cual viene a confirmar que los antecedentes familiares provocan una mejor detección de la enfermedad, profilaxis y tratamiento.
• El medio Rural es aquel que sufre mayor porcentaje de retraso en el tratamiento, pero es también el que mayor proporción de población y enfermedad acumula por lo que esto no sería significativo.
• La mayor cantidad de retrasos en el tratamiento se dan en la población que no tiene acceso a agua potable.
• Apenas un 2% de retraso en el tratamiento en los estratos más ricos, siendo por tanto el retraso mucho más presente entre las clases sociales más bajas.
• La provincia de residencia, sexo o estado nutricional no influyen significativamente.
• En cuanto a la distribución por edad, la campana de gauss que dibuja el retraso en el tratamiento por edad es similar en aspecto y proporción para aquellos que han sufrido retraso comparado con los que no lo han hecho.


9. APARICIÓN DE LOS SÍNTOMAS

Tiempo que transcurre entre la exposición y la aparición de los síntomas en días.
En la población enferma (casos) la media de aparición de síntomas es: 8,5 días.
Si contamos solamente aquellos que no han recibido la profilaxis la media es de 9,24 días. Mientras que aquellos que la han recibido: 7,13 días.
Esto aparentemente indicaría que la profilaxis reduce el periodo de incubación.

La prueba de X2 no puede confirmarnos la asociación entre la aparición de los síntomas y la profilaxis, por la existencia de valores por debajo de 5.

10. DURACIÓN DE LOS SÍNTOMAS

La media de la duración de los síntomas es de 5,33 días.
En individuos que no han recibido profilaxis: 4,83 días.
En individuos que han recibido la profilaxis es de: 6,33 días.
Podría concluirse que la profilaxis hace que los síntomas duren más.

La prueba de X2 no puede confirmar la asociación entre la duración de los síntomas y la profilaxis por haber valores menores que 5.


11. PROFILAXIS

Se trata de nuestra variable de exposición en este estudio. Es un parámetro muy clarificador, pues observamos que directamente aquellos que han recibido algún tipo de profilaxis tienen mucha menor proporción de enfermedad: 70,91% frente a 28,57%.