¿Cómo editar la dimensión del censo?

Estructura para datos de censo

Para calcular datos como incidencias y canales endémicos se requiere la información de población por año, previamente desde el departamento de epidemiología se usaron archivos tipo Excel separados por hojas con los datos respectivos, una estructura típica se vería de la siguiente manera:

imagen, Estructura para datos de censo

En el lado izquierdo vemos el código MINSA y el id de corregimiento (dado por SISVIG), en el centro vemos categorización de hombre (s) y mujer(es) y al lado izquierdo vemos en celdas blancas sin fondo el valor consignado por grupos de edad según el sexo para una población de corregimiento, abajo, nombres de las hojas que son procesadas.

Vamos a determinar los puntos importantes en esta estructura y determinamos su uso y lectura.

Nombres hojas a procesar.

Los archivos de censo poseen varias hojas, las hojas que se procesan son: CHIRIQUI, BT, COCLE, COLON, DARIEN, HERRERA, LOSSANTOS, ESTE, PMANORTE, METRO, SMGTO, VERAGUAS, KUNA_YALA, NGABE_BUGLE, P OESTE, R ARRAIJAN y R OESTE - se han mantenido los nombres originales sin acentos y otros caracteres - y se debe usar exactamente el mismo nombre, de lo contrario una hoja no sería procesado.

Note que la hoja País o Consolidado país no se procesa.

imagen, Nombres hojas a procesar.

Las hojas de censo sufren unas modificaciones para convertirse de formato de hoja de Excel a un formato tabular, este proceso es aplicado a cada año y a cada hoja, el resultado es una consulta con datos que pueden ser usados por otros sistemas.

Consolidación del Censo

El proceso tiene en cuenta varios puntos clave en las hojas, por ejemplo en la columna de Sexo se analizan valores como Hombre, Mujer y Hombres y Mujeres, las filas que contienen el texto en plural son descartadas pues se consideran subtotales, así que cada fila con valor en singular (hombre, mujer) el sistema lo tiene en cuenta.

Adicionalmente de las hojas y el valor en singular, los nombres de las columnas de grupos etáreos del censo no deben ser cambiados pues se usan para categorizar y agrupar según la dimensión de grupo etáreo de SISVIG.

Finalmente, se debe insertar o mantener el código MINSA (útil para otras instituciones) y el id corregimiento (id de la tabla corregimientos de SISVIG).

El flujo de datos consolidará cada hoja de población y lo entregará como única tabla llamada CensoPanamá, con los campos antes mencionados.

El flujo de datos de censo

Un flujo de datos en Power BI es un conjunto de operaciones realizadas previamente y cuyo resultado se desea compartir con terceros (otras personas en la organización, otros sistemas de información o hasta otras entidades).

Esto permite que la extracción y transformación (compleja o no) que pueda tener una unidad de información pueda realizarse “tras bambalinas” y posteriormente ser compartida por el autor, en este caso el sistema de reportes de Power BI - cabe anotar que requiere uso de licencia PRO.

El flujo de datos de censo (y otros flujos) han sido publicados por el usuario Control (ver triada de gestión de información), así que un usuario de la organización (MINSA) podría acceder a estos, comúnmente desde Power BI al obtener datos - y con los permisos correspondientes - el sistema muestra algo similar a lo siguiente:

imagen de flujo de datos de censo

Una vez leídas las estructuras, tenemos lo siguiente:

imagen de navegador

Actualmente se han compartido los flujos de datos de geografía, grupos etáreos, censo y datos de notificación individual, colectiva y mortalidad.

En esta pantalla podemos cargar los datos ya pre procesados o incluso realizar más transformaciones como por ejemplo filtrar años que no requerimos u otras tareas y ajustes.

¿Editar el flujo de datos?

De entrada la respuesta rápida es: En la mayoría de los casos puede ser simple, pero el censo es posiblemente uno de los flujos de datos más complejos que se puedan crear, por ende evite la edición del mismo pues está compuesto de una buena cantidad de archivos, consultas y consolidaciones que pueden llegar a ser un reto para la mayoría de usuarios.

Cada hoja consolidada se lee en todos los archivos disponibles, crea una función y una consulta que consolida todos los años, posteriormente se unen todas las hojas, cada consulta puede tener una buena cantidad de pasos internos .

imagen de ¿Editar el flujo de datos?

El sistema de Microsoft advierte que existen muchas consultas en el mismo script, es normal pero reitera la complejidad del script.

En resumen, acceda al script sólo si tiene buenos conocimientos de scripts para Power Query y comprende las consultas en el flujo de datos, recuerde que este sistema no permite realizar copias o duplicar un script que esté siendo usado en reportes, por lo cual es posible que un mal cambio lleve a un mal funcionamiento del sistema de reportes.