¿Cómo se procesan los canales endémicos?
Tenga en cuenta: En la documentación para el usuario de la salud se explica la metodología usada para este cálculo.
En esta página nos enfocaremos al aspecto técnico y de sistema de información.
Se ha diseñado esta página como un único documento para facilitar su exportación a otros formatos como PDF - para ser compartido fácilmente por el equipo interno.
El control de la información que se va a calcular
Antes de entrar en detalle se debe tener en cuenta que en la hoja de configuración de eventos se puede determinar si se va a calcular incidencia y canales para cada evento. Si un evento está configurado por ejemplo para no ser mostrado, tampoco recibiría cálculos, básicamente es un sistema que calcula a medida.
Adicional a calcular un evento se configura si se procesa un tipo de notificación, multiplicadores para incidencia y si se genera o no un canal endémico.
Resumen del proceso y la adición de datos al reporte.
Aunque el título pueda parecer intimidante es importante entender que el cálculo de los datos para procesar los canales está dividido en al menos 4 pasos importantes, básicamente este proceso se calcula fuera de Power BI, vamos a analizar globalmente el proceso y luego entraremos en detalle.
El resumen de la generación de información que se procesa en los canales endémicos implica tener una información, procesarla en una plantilla y esa información consolidarla en el archivo de Canales del sistema de reportes.
Tenemos entonces qué internamente el sistema de reportes en Power BI usa la información que encuentra en el archivo “Canales.xlsx” del OneDrive compartido al departamento de Epidemiología.
El sistema de reportes procesará la información que aparezca en el archivo compartido, al separar estos datos y su lógica del sistema permite usar diversas metodologías de cálculo, el sistema procesará la data sin importar el proceso realizado.
Este archivo contiene algunos campos que ayudan a determinar los datos necesarios para crear las gráficas, como es natural se identifica el Evento con un ID (que es interno del sistema de reportes), una dimensión de tiempo de año epidemiológico y semana epidemiológica junto con los datos de incidencia, estos tres datos son descargados de las hojas utilitarias del reporte (ver más adelante), adicionalmente los cálculos de Desviación Estándar, Umbrales de alerta, Límite Inferior y Umbral estacional.
Identificado el evento se leen los datos de dimensión de tiempo y de incidencia y datos estadísticos para los gráficos.
A continuación veremos entonces cómo se realizan estos pasos para generar el archivo antes mencionado (Canales.xlsx).
La fuente de información de los canales
Para iniciar el cálculo se inicia con los datos de casos por tiempo, se sugiere en Desktop - e ir a la hoja Casos para incidencia - cabe aclarar que no se requiere generar nada - estos datos le permitirán ver de primera mano si posee datos en blanco, cuando se poseen muchas semanas sin dato, el cálculo de los canales puede resultar impreciso o simplemente no útil - esto varía según la metodología a usar.
Para iniciar el proceso, el sistema requiere del número de casos, aunque no requiere descarga aún de datos pues estos datos deben ser usados posteriormente para la incidencia, es decir el cruce de datos de casos vs la población.
Dicho de otra manera para iniciar el proceso se sugiere tener acceso a las hojas de utilitarios del reporte en Power BI Desktop.
Por otro lado, la información fuente para canales que lee el sistema de reportes posee la siguiente estructura.
- Evento, id_evento (en rojo)
- Año epi, sem epi, incidencia (en azul)
- Curva Epidémica, D. E, Umbral de Alerta, Límite Inferior, Umbral Estacional (en verde)
El sistema de reportes lee un archivo llamado Canales.xlsx - esta estructura es independiente de la metodología de cálculo, usa datos del sistema de reportes (como la incidencia) y calcula los valores clave para poder graficar.
Tenga en cuenta que el sistema de reportes le entregará la información de Año Epidemiológico, Semana Epidemiológica e Incidencia (como datos planos CSV), junto con los datos del evento y su respectivo ID ya que la información también será mostrada de igual manera, identificando el evento por ID.
Esto quiere decir que la única manera de generar canales y datos para analizar varios eventos como si fueran uno solo sería generar toda la información, consolidarla y visualizarla directamente en Excel en la plantilla, pero al no existir un evento con un ID dentro del sistema (como evento agrupado) este no sería mostrado en el sistema de reportes - podrá calcularlo y en la plantilla se visualizarán datos de referencia, pero no en el sistema de reportes.
La información de cálculo podría ser entregada por cualquier sistema fuente u hoja de cálculo que genere los valores de umbrales, alertas y curvas, existen varias maneras de cálculo, sin embargo el equipo de desarrollo contratado entregó una plantilla de tipo macros en Microsoft Excel que le ayudaría al proceso.
En caso de cambiar la metodología, esa nueva metodología arrojaría los datos de curva, desviación estándar, umbrales y límite, así que se podría reemplazar la plantilla antes mencionada.
Cómo generar los datos fuente - paso 1
Para la generación de archivos fuente, se debe generar la incidencia, es decir, en la hoja Casos para incidencia se pueden generar los datos requeridos, población y casos - incidencia - y se genera para notificación individual o notificación colectiva.
Estos son los datos base para poder empezar el proceso de cálculo de generación de canales, se genera un archivo por evento según sea individual o colectiva, para ello use la opción “Exportar Datos” que aparece en las opciones de la tabla (el menú de tres puntos) y genere el archivo CSV.
En la hoja de Incidencia Notificación Individual o Incidencia Notificación Colectiva, se generan los archivos planos requeridos para calcular los canales para un evento.
Estos archivos deben ser abiertos en Microsoft Excel y generar una tabla que pueda ser usada en la plantilla de Excel para cálculo de Incidencia.
Este proceso inicia entonces abriendo el archivo plano, en este ejemplo usaremos un evento de ejemplo, exportamos los datos y los abrimos con la hoja de cálculo Microsoft Excel.
Generado el archivo CSV, es momento de darle forma para usar la plantilla.
Consejo: Para generar la información de cada evento se sugiere crear esta estructura de carpetas, será un proceso repetitivo (tantas veces como años desee calcular) y le permitirá tener una mejor planificación de su trabajo.
Los archivos separados por comas o CSV no tienen formato y son series de datos, para realizar el cálculo en la plantilla debemos darle una forma tabular, iniciamos el proceso abriendo el archivo, seleccionando la columna, y vamos a separar los valores, para este ejercicio lo haremos con la opción de Datos - Texto en columnas.
Usaremos la opción separado por comas para tener la información separada.
Marcado el texto como Delimitado y seleccionando la opción del separador correspondiente, damos finalizar.
En este ejercicio vemos que el separador fue el caracter “coma”.
Abierto el archivo tenemos los datos que entregó el sistema de reportes.
Los datos ya aparecen en una forma tabular o de tabla, ahora podemos abrir nuestra plantilla y empezar el paso 2.
Consejo: Este archivo guárdelo en la carpeta que haya determinado como fuente, en formato Excel, asegúrese de seleccionar este formato, pues previamente ha abierto un CSV y si lo guarda simplemente sin cambiar ninguna opción perderá el proceso realizado.
Usando la plantilla - Paso 2
Para el paso 2, asegúrese de tener disponible la plantilla oficial llamada “Plantilla canales curva endémica promedio.xltm” - esta plantilla una vez que se da doble clic generará un archivo nuevo que es el que guardaremos inmediatamente en la carpeta 3 - Salida.
El tipo de documento debe aparecer como “Plantilla habilitada para macros de Microsoft Excel”.
Nota: Las archivos plantilla una vez que son “llamados o abiertos” generan una copia, esto permite mantener siempre la plantilla a salvo de cambios, el archivo generado ya puede ser guardado con el formato que el usuario disponga, como es obvio sería Archivo de Microsoft Excel regular, tal como lo haría con cualquier archivo.
Una vez que hemos ingresado a la plantilla tendremos un área de trabajo dividida en 6 secciones, las 5 primeras en la hoja “Plantilla” y la sexta sección en la hoja “Salida”
Aunque la imagen puede diferir del archivo original, la primera hoja “Plantilla” tiene 5 secciones, adicionalmente es posible que le aparezca un indicador de que “Debe habilitar las macros”.
En la imagen anterior vemos una representación de su contenido (no es igual ya que las secciones están dispuestas horizontalmente), estas secciones es donde se ingresarán los datos (también en la hoja “Salida”) y con esos datos se generarán los cálculos para los canales.
Adicionalmente, en cada sección aparece un botón de Ayuda para cada sección.
Una vez que hemos abierto la plantilla y hemos habilitado las macros estamos listos para el paso 3, guardar este archivo en la carpeta “Salida” con el nombre descriptivo de evento que desee.
Nota: El segundo paso consiste básicamente en abrir la plantilla, este archivo resultante será el que trabajemos en el paso 3-Salida, se sugiere guardar el archivo en formato Excel.
Generado data para procesar - Paso 3.
Con el archivo producto de ejecución de la plantilla, lo guardamos en la carpeta 3-Salida en formato Excel - Libro de Excel habilitado para macros. Generará un archivo tipo Xlsm.
Ahora que ya tenemos lista y dispuesta la plantilla para recibir los datos, requerimos alimentarla en dos etapas diferentes, etapa de salida y etapa de datos origen.
Volvamos al archivo del paso 1-Fuente (que previamente ha sido abierto, separado por comas -o punto y coma - y guardado en formato Excel), debemos crear las dos etapas de información.
Etapa de datos salida paso 3.1
Debemos ordenar las columnas el siguiente orden: Evento, Id_evento, Año Epi, Sem Epi, Incidencia - tenga en cuenta que el sistema podría haberle entregado semana primero antes que año.
Con los datos seleccionados (todos los datos incluyendo los encabezados) vamos a la opción ordenar para así asegurar un orden correcto de datos.
Tip: En Excel, se puede seleccionar una celda que forme parte de la matriz de datos, posteriormente presionar CTR + * y se seleccionarán todos los datos.
Después de ordenar las columnas, procederemos a ordenar los datos.
Con los datos ordenados, copiamos todo sin los encabezados y vamos a la hoja “Salida” de la plantilla - archivo generado previamente en el paso 2.
No olvide copiar y pegar como valores - asegúrese que el orden es correcto.
ATENCIÓN: Si el sistema le ha generado datos de años que no va a procesar como 2024, 2025 estos pueden ser eliminados antes o después de copiarlos. En este ejercicio tomaremos desde 2015 - que es el inicio de datos que posee el sistema de reportes hasta 2023, el año actual - .
Copiados los datos nos moveremos hasta el primer año para el que generaremos el primer cálculo, en este ejemplo tomaremos desde 2015 hasta 2023 - teniendo en cuenta que se requieren 5 años de datos para un cálculo adecuado, generaremos datos de canales desde la semana 1 de 2020 - en el ejemplo en la celda F268 - podría variar - y estaríamos listos con el paso 3.1
Nos ubicamos en la celda correspondiente del primer año que posee información, vamos a generar desde 2020, así que nos hemos ubicado en el año 2020 y semana 1, nos ubicaremos en la celda de Curva Epidémica.
Etapa de datos origen paso 3.2
Tenga en cuenta la estructura que pide la hoja “Plantilla”
Para alimentar los datos origen para los canales se requiere la estructura de semana vs año con datos de incidencia, nuestro archivo fuente no posee esta estructura así que debemos generarla.
Debemos volver entonces a nuestro archivo inicial generado y separado en columnas que hemos ordenado previamente, ahora volvemos a seleccionar todos los datos (CTR+*) y crearemos una tabla dinámica sencilla.
Seleccionamos los datos y crearemos una tabla dinámica que cumpla con la estructura solicitada.
Establecemos en el área de filas el campo Sem Epi, en el área de Columnas el campo Año Epi y en el área de valores el campo de Incidencia, por defecto asumirá la suma como valor agrupador.
La tabla dinámica generada ya posee la estructura requerida.
Los datos resultantes - podrían integrar los años o no - son los que llevaremos a la plantilla, en el ejemplo vemos que tenemos datos hasta el año 2023 (2023 no completo al momento de este ejercicio) y estos datos son los que copiaremos- NO incluya Totales.
Copiados los datos los pegaremos con la opción “Pegar solo valores” en la hoja de “Plantilla”, si no copió los encabezados del valor del año puede insertarlos de manera manual posteriormente.
De esta manera estaríamos listos para iniciar el proceso de cálculos, como hemos determinado previamente son 6 secciones y hemos cumplido con la sección 1 - Tasa de incidencia.
Sección 1 - Tasa de incidencia
Si realizaste el paso anterior habrás copiado los datos fuentes en formato de año semana de valores de incidencia al área de la sección 1 - Tasas de incidencia o la fuente.
Básicamente no hay problema alguno en copiar tantos años como requiera, en el ejemplo copiamos hasta 2023, asegúrate de tener cada etiqueta de año correspondiente. Ello permitiría realizar este proceso una sola vez, aunque no aplica para las demás secciones.
Tenga en cuenta que existen años con semana 53, por otro lado el año 2023 - al momento de esta documentación no estaba completo - con ello los datos resultantes podrían tener valores algo diferentes en esa semana.
Con los datos aquí insertados y las etiquetas dispuestas vamos a la sección 2.
Sección 2 - Medidas móviles de 3 semanas
Esta sección genera medias móviles cada 3 semanas, ya está formulado al iniciar para los cinco primeros años, para calcular el año 2020 - en nuestra primera iteración, simplemente copiamos y pegamos las fórmulas del año anterior.
Para cada año requerido se copian y pegan las fórmulas del año anterior.
En el caso específico del año 2020, copiamos una celda adicional.
Iteraciones: En la fuente de este ejemplo vemos datos hasta 2023, lastimosamente no es viable realizar en un solo movimiento todos los cálculos, pues estas macros están dispuestas a calcular datos para un solo año, así que pegaremos sólo hasta el año que vayamos a analizar - 2020 en el ejemplo - asignamos las etiquetas de años y después de terminar el proceso volvemos a esta sección 2, para adicionar otro año e ir iterando tantas veces como sea necesario, es decir, 2021, 2022, 2023 - no es necesario volver a la sección 1 ya que la fuente no requiere este proceso iterativo.
Sección 3 - Alineamiento de semanas pico (la macro)
Esta sección es quizás la más importante y la razón de haber creado una macro que se encargue “del trabajo sucio”, básicamente alinea las semanas pico para el proceso - de acuerdo con esta metodología - no es necesario borrar la información previa (cuando estemos en la iteración 2, 3, etc.) - y simplemente se podría resumir en dar clic al botón “Alineaar Máximos con Semana Mediana” - después de unos instantes veremos un cuadro de confirmación.
Nos aseguramos de tener las etiquetas de los años correctamente y estamos listos.
En este ejemplo vemos que el pico fue alineado en la semana 28, nos sale una ventana que nos avisa del proceso.
Listo, nuestro paso por la sección 3 ha finalizado, no requerimos ninguna acción adicional.
Sección 4 - Salida de datos para el año a analizar
Esta sección contendrá los datos resultantes y listos para el año analizado - recordemos que en la primer iteración sería 2020 - así que será cuestión de copiar y pegar a la hoja Salida.
Hemos seleccionado los datos sin las etiquetas de semana o las de los títulos.
Si hemos seleccionado previamente la semana 1 del año 2020 en nuestro ejemplo, estaríamos listos para hacer una copia de los datos resultantes - se sugiere copiar y pegar sólo como valores.
Asegúrese de alinear la semana y año correspondiente a los datos resultantes.
Tenga en cuenta que es normal que los años anteriores no posean datos pues finalmente hemos realizado el cálculo para el sexto año, en nuestro ejemplo 2020.
Sección 5 - Gráfica de control
Si nos desplazamos a la derecha veremos la sección de la gráfica de control, es generada basada en los datos que actualmente aparezcan en la plantilla.
Adicionalmente a la parte funcional es claro que podría servirnos esta gráfica en caso en que estemos analizando un evento con datos que no provengan necesariamente del sistema de reportes y podrá ser usada en documentos tipo Word o Power Point.
Nuevas iteraciones - 1 por cada año a analizar.
El proceso debe ser repetido tantas veces como años se tenga para generar datos.
Tenga en cuenta que los cinco primeros actúan como base de cálculo, es decir, no se generarán datos para los primeros cinco años o series.
Así que si insertamos desde la fuente seis años, sólo generaríamos datos para 1 año de análisis, en ese escenario no es necesario repetir ningún proceso.
Sin embargo es común que se generen varios años de cálculo, así que la fuente puede tener 10 años y ese proceso se realiza una sola vez, para los años 6, 7, 8, 9 y 10 se realizará una interacción por año, es decir vamos a la sección 2, copiamos y pegamos las fórmulas, corremos la macro - ajustando las etiquetas de los años - y tendremos los resultados de ese año, obtendremos también la gráfica de control y debemos pasar los datos resultantes a la hoja de Salida - este proceso lo haremos tantas veces como requiera la información.
Sección 6 - Generar datos del evento
Una vez que hayamos culminado las iteraciones por año, es posible que al finalizar el año en curso tengamos datos o resultados de semanas que no han ocurrido en la línea de tiempo, básicamente podemos eliminar esos datos o simplemente no copiarlos.
Para este evento se generó el año 2023, al momento de hacer el ejercicio se tenían datos hasta semana 25, se eliminaron (o simplemente no se copiaron) datos para estas semanas o años posteriores.
Este archivo que hasta el momento se ha ido grabando en la carpeta 3-salida con soporte a macros ahora formará será la base para alimentar el archivo de consolidación llamado Canales.xlsx que está disponible en la carpeta de OneDrive.
Tenemos los datos, ahora vamos a consolidar el archivo de Canales.
Para el paso se sugiere descargar una copia de Canales.xlsx y ubicarla en la carpeta 4-Consolidar.
Importante: Es cierto que se pueden copiar y pegar los datos directamente al archivo en línea, la metodología de tenerlo en local por evento es para evitar errores por descuidos u olvidos en caso en que estemos consolidando varios eventos y varios años.
Teóricamente nada impide que tome los datos de la hoja Salida y los lleve directamente al archivo online.
Consolidar datos - Paso 4
Tenga en cuenta que al momento de iniciar el sistema de reportes, este sistema lee de manera directa el archivo de Canales.xlsx disponible en OneDrive y que posee ya unos datos para unos eventos, es viable eliminar todos los datos anteriores o adicionar nuevos, sin embargo si se repiten datos de un evento el sistema va a acumular los resultados.
En ese escenario es clave que si se van a realizar varios procesos de generación de canales se descargue una copia del archivo de canales.xlsx, se eliminen todos los datos y se aloje una copia de cada uno en la carpeta 4-Consolidar, de esta manera al terminar varios eventos (cada uno con su respectiva carpeta) podrá consolidarlo todo en un último archivo sin temor a alguna configuración no deseada.
Sin embargo, si va a generar datos para un solo canal, basta con generar los datos de salida de la carpeta 3-Salida y tomar los datos de la hoja salida y copiarlos y pegarlos al archivo Canales.xlsx al final de los datos existentes.
La generación de este archivo también flexibiliza la generación de canales por varias personas, una vez terminados podrán enviar por diversas vías el archivo a la persona que gestiona el archivo oficial y este simplemente realizará el proceso de adición de datos.
Actualizar el archivo de Canales en OneDrive
En la triada de información, el usuario Control ha compartido previamente el archivo al desarrollador y a la cuenta de publicación. Adicionó también a personas que alimentan el archivo, en este caso el departamento de Epidemiología.
Pues bien, las personas con acceso a este archivo son las que finalmente podrán actualizarlo, por ende se sugiere crear siempre una copia de backup del archivo.
No se sugiere borrar el archivo y subirlo de nuevo, pues el sistema de OneDrive ha generado unas firmas o marcas especiales para el archivo que está leyendo, si sobre escribe el archivo es posible que la estructura interna no coincida necesariamente.
En resumen, debe editar directamente el archivo, copiando, pegando información de eventos que se adicionan o incluso eliminar información de eventos.
¿Cómo se actualiza en el sistema de reportes?
Tenga en cuenta que el sistema de reportes se actualizará varias veces al día, sin embargo los archivos de canales se actualizan dos veces por día, así que una respuesta rápida sería informar que en términos de 24 horas la información estará desplegada totalmente, todo ello de manera automática.
Si requiere actualización manual debe actualizar el conjunto de datos, los flujos de datos (cada uno) y el sistema de reportes y esperar entre 10 minutos a 120 minutos a que Microsoft despliegue la última versión en el navegador.