¿Cómo se calculan los canales endémicos para algunos eventos?

Tomado de: Elaboración de corredores o canales endémicos mediante planillas de cálculo -Marcelo Bortman

De este documento podemos determinar algunos puntos clave a tener en cuenta:

  • Determinar un “exceso” está ligado a conocer aquello que consideramos normal o que esperamos encontrar, por ende si tenemos un dato esperado y el resultado está por encima o por debajo de este valor podría considerarse exceso.
  • De acuerdo con la distancia o intervalo que existe entre los datos tendríamos los umbrales, es decir si para un valor X consideramos que los valores promedio están por encima y por debajo en 10 diríamos que X+10 y X-10 son valores dentro del rango esperado, aquello que incumpla esto podría ser considerado exceso - o datos atípicos (que implicarían otro tipo de análisis).
  • Para generar canales endémicos requerimos datos que debemos tener en cuenta:
    • El dato de población que está disponible como flujo de datos en el proyecto, a nivel geográfico de corregimiento ello implica automáticamente que si quisiéramos sacar canales de una población más pequeña como localidad no sería viable pues no se tiene el valor agrupado a ese nivel.
    • De igual manera en la variable tiempo considerando que es bastante difícil tomar la población cada mes, el dato a analizar sería anual como una constante que se ajusta cada año - evidentemente el número de casos si es posible tenerlo incluso fecha a fecha o por semana epidemiológica, considerando que los datos pueden cambiar durante la semana producto de un análisis de experto.
    • Los datos colocados como flujo de tipo población aparecen desde el año 2015 y dentro de las metodologías (incluida la de Marcelo Bortman) sugieren tener un periodo mínimo de 5 años para lograr estadísticas confiables, ello implica que los canales a graficar con un nivel de confiabilidad mínimo serían elaborados desde 2020 en adelante.
    • Los años atípicos donde los valores salen incluso de los promedios regulares producto de fenómenos externos no deberían tenerse en cuenta, por ejemplo, digamos que producto de un huracán e inundaciones se disparan los números de contagio de gripa pues la gente fue más expuesta - o la pandemia COVID donde las personas no salían de su casa lo que llevó incluso a la disminución de los casos de gripe común. En ese orden de ideas el experto podrá determinar si un año puede ser considerado para su análisis.
    • En enfermedades agudas o graves y consideradas de alto nivel de atención posiblemente la unidad geográfica corregimiento sea muy grande, dadas las estrategias de contención que suelen ocurrir - vigilancia activa y reactiva - lo mejor sería elaborar canales con datos más específicos.
    • Por otro lado, si analizamos un periodo concreto que suele ser estacional, está bien considerar los datos para análisis, por ejemplo, en una población que suele aumentar sus casos de evento en la época de vacaciones, probablemente también se registre un aumento de su población flotante, si este fenómeno se mantiene año a año, los datos podrían considerarse consistentes, aunque es claro que la mejor metodología será contabilizar también la población flotante.
    • Para análisis más específicos requerimos datos específicos, por ejemplo, el síndrome de túnel metacarpiano se presenta con mayor impacto en personas que trabajan en oficinas y que su herramienta en la mayor cantidad de horas es un computador, si tenemos la población, pero no determinamos cuántos de ellos van a oficina y pasan la mayoría de horas frente a un pc usando un teclado y mouse estaríamos realizando un análisis que puede mejorar en su metodología (incluso que usen teclado, pues hay trabajos con pantallas táctiles cuyo sistema de ingreso no reportaría esta dolencia)
    • Los análisis que muestren datos fuera de todo comportamiento requieren de otras técnicas para manejar umbrales de error o técnicas estadísticas para repoblar los datos faltantes, esto es un detalle a determinar por el experto en estadística y epidemiología.
    • Los resultados de estos análisis deberían poder ayudar a prever dotación e insumos, si sabemos que cada diciembre tenemos quemados por fuegos artificiales, las partes operativas deberían dotar de insumos para atender este evento desde noviembre, es decir los canales son herramientas clave en la prevención, no debería esperarse que funjan solo como datos estadístico de lo ya ocurrido.

Los datos de los canales

Aunque existen varias metodologías, teóricamente podemos afirmar:

  • Si tenemos un registro por tiempo y geografía de un evento, tendríamos promedios que podrían mantenerse y generar un “canal” con un porcentaje de confiabilidad, dicho de otra manera, podríamos esperar que si todos los meses tenemos 10 casos de un evento, el siguiente mes tendríamos 10 casos esperados.
  • Ya que el espectro de “lo esperado”, “lo normal” es complejo y no depende de la gravedad del análisis o del conocimiento del epidemiólogo, existen canales específicos para algunos eventos, es decir, un caso de cólera debería prender las alarmas de atención y exige una intervención temprana y oportuna, con 10 casos del mismo evento tendríamos que determinar estrategias diferentes, mientras que 10 casos de gripa en una población se podría tomar como muy bajo, esta es la razón por la cuál se debe trabajar bajo proporciones o tazas, en términos de porcentaje
  • Así que vamos a definir al menos 4 momentos clave:
    • Zona de éxito: Son los valores esperados, suelen tener cero o el valor promedio generado.
    • Zona de seguridad: es ese margen en que se mueven los datos, suele estar determinado también por los picos promedio de los rangos de tiempo analizados, forma parte del cuartil inferior en una gráfica común.
    • Zona de alerta: A nivel operativo conlleva activar los protocolos de intervención - cualesquiera que fueren - implica atención y suelen coincidir con la mediana.
    • Zona epidémica: ubicados en el último cuartil, son los datos donde la situación muestra la peor faceta.
    • Aunque valores positivos registran momentos en canales epidémicos, al tratarse de un tema de salud, los valores negativos - la ausencia de notificación o disminución de casos - aquí son tomados como entradas de éxito, pero no siempre es así si hablamos de canales, específicamente de canales compuestos por ejemplo, embarazados con o sin un comportamiento, pero para efectos del sistema de reportes esto se sale del alcance.

¿Qué ocurre con los datos faltantes?

Si tenemos en cuenta por ejemplo que no todos los años tenemos una semana epidemiológica 53, en aquellos años en que si se tenga y si se analiza por semana epidemiológica, los datos serán totalmente atípicos o para no tener en cuenta.

Si se analiza entonces por semana epidemiológica y se llega a la semana 53 - entendiendo que en un análisis típico de 5 años mínimo será muy complicado que dos años contengan esa semana - lo mejor sería desechar el análisis la semana 53, también se podrían poblar los datos de la semana 53 no existente de los otros años con los promedios regulares de la semana 52, 51, 50 , la variación para tomar ese valor depende de la metodología e incluso del criterio del analista.

En resumen, podemos completar los datos faltantes, poblarlos o incluso desecharlos, según la metodología y los criterios existentes.

¿Análisis específicos de eventos con otras dimensiones?

Los datos de canales generado en el sistema epidemiológico no discriminan sexos o grupos etáreos sino que se toman como población en general por periodos de tiempo anuales.

La razón de esta decisión es que para generar canales funcionales a nivel de concepto, se requiere que cada semana posea una notificación - si se quisiera analizar por semana - incluso aunque el reporte sea cero.

Sin embargo existen eventos donde la ocurrencia del evento es dispar, no es continua lo que generaría valores promedio que no permiten llevar un buen seguimiento, en estos casos este tipo de análisis de canales debería ser ejecutado por el experto directamente.

Aunque suene contradictorio, el mejor escenario para crear canales endémicos es aquel evento que posee notificación continua y estable, así que la buena noticia es que si no necesita este tipo de análisis se encuentra en un evento con baja afectación.

Es cierto que tenemos los datos por sexo y grupo etáreo, pero en este punto el sistema de reportes no debería generar semanas en falso, es decir en cero ya que el cero se tomaría como elemento y por ende como parte del análisis y promedio, dicho esto entre más detalle ingrese en un canal, probablemente más difícil será tener una línea de datos continuos.

Por ejemplo, si un evento en promedio anualmente presenta 10 casos, muy probablemente no tenga una notificación cada mes (12 meses) por ende se consideraría erróneamente un promedio mensual y mucho menos semanal.

Si a ello adicionamos la variable de sexo y grupo etáreo, la cantidad de datos disponible en la tabla sería insuficiente y si se “pueblan los datos” estaríamos generando promedios o datos no regulares ni reales donde el cero tiene un valor y sentido de análisis.

¿Excel como herramienta de trabajo?

Si el sistema está realizado en Power BI, ¿Porqué no tener este análisis en esta herramienta?

Como hemos citado previamente es posible que se requieran de técnicas adicionales para poblar los datos faltantes, adicionalmente el uso de una macro permite generar una alta cantidad de datos de manera más rápida que dentro del sistema que ya posee una inmensa carga de procesos.

Dicho de otra manera, el sistema es demasiado grande como para realizar estos análisis ya que exigiría cargar este sistema para la generación de pocos datos, es mejor usar una herramienta más adecuada, adicionalmente la base de esta programación se realizó inicialmente en Python y lenguaje R, pero se desechó la idea ya que mantener ese código implica conocimientos específicos que son más costosos que conseguir un operario con un nivel medio alto en Excel.

¿Qué genera el sistema? - Casos csv.

Actualmente el sistema de reportes posee características adicionales a las que se muestra en la versión web, para visualizarlas se debe usar Power BI Desktop.

Dentro de las herramientas creadas tenemos una hoja llamada “Casos para incidencia” que básicamente genera una tabla que contiene los casos de un evento seleccionado a través del tiempo por semana epidemiológica, en el siguiente ejemplo vemos “Dengue con signo de alarma”, pues bien, esta tabla resultante se puede generar como archivo descargable CSV si es que se requiere.

Imagen de casos csv

El archivo descargable separado por comas puede ser abierto dentro de Microsoft Excel y sería el insumo base para el cálculo de la incidencia, el archivo se ve de la siguiente manera. Sin embargo el sistema de reportes va un paso más allá.

Imagen de casos csv

De acuerdo con el archivo de configuración de eventos - recordar que es el archivo que controla toda la configuración del sistema - tomará los valores y opciones para el evento, es decir:

  • Lee si el evento debe ser procesado
  • Lee si al evento se le debe calcular tabla de casos e incidencias
  • Lee el multiplicador y la decisión para cada tipo de notificación sea individual, colectiva y mortalidad - incluso se podría generar letalidad.
  • Basándose en los parámetros leídos y en la información entregada (es decir, desde el sistema de SISVIG debe recibirse información del evento) el usuario de epidemiología podría generar la incidencia.
Imagen de casos csv

Exportada la tabla generada estamos listos para usar la plantilla con macros de Excel que se encargará del resto de cálculos.

Con los datos exportados se abre la plantilla para el cálculo de canales con curva epidémica usando promedios, está tiene 5 áreas bien marcadas que son:

  • Área marcada en verde - tasas de incidencia - allí pegamos los datos que hemos exportado previamente con ese formato, semana vs año a analizar, para el caso en que se adicione 2024 se debe insertar una columna nueva en cada área y así el sistema incrementaría en un año, sin embargo recordemos que es viable realizar cálculos a partir del 5to año.
  • Área de medias móviles - cálculo automático
  • Área de alineamiento de la semana pico (incluye en esta área el botón que procesa la macro)
  • Área de resultados, aquí se entregan los datos de curva epidémica, D.E y umbrales de alerta.
  • Área de gráfica de control.
Imagen de casos csv

Nota: Esta captura no busca que el lector pueda ver el detalle de los datos, sino que pueda visualizar de manera general que el archivo posee las 5 áreas antes nombradas, cada fase posee instrucciones si es que requiere y el punto importante es que el botón de procesar y alinear los valores máximos con la semana mediana aparece disponible para ejecución.

La última área es la que usaremos para calcular y graficar los canales, esta información requiere adicionar el nombre del evento, el ID (que aparece en el archivo de configuración de eventos) y los datos resultantes.

El archivo Canales de Excel

Los canales epidemiológicos que se vayan a procesar por evento son almacenados en el archivo Canales.xlsx (en la versión de onedrive).

Adicional a la data entregada por la plantilla como incidencias, curvas y umbrales se debe pegar también el nombre del evento y el ID, se pegan al final. Sobra decir que si previamente se han calculado los datos para un evento y se duplican estos datos, el sistema duplicará la información, en la siguiente imagen vemos que al final del archivo se han calculado los datos para VARICELA, si previamente existen datos de VARICELA se sugiere eliminar esa información previa.

Imagen del archivo Canales de Excel

Los resultados en el sistema de reportes

El sistema de reportes procesará el archivo Canales.xlsx (de onedrive) y desplegará esta información en la hoja de Análisis.

Imagen del sistema de reportes

Links recomendados

Revisar: https://www.scielosp.org/pdf/rpsp/v5n1/5n1a1.pdf