Please use this identifier to cite or link to this item:
https://172.23.39.185/handle/1000/117
Subsistema Automatizado de Egresos Hospitalarios Sector Salud, series de tiempo 2004-2020 | |
Lina Sofia Palacio Mejía Juan Eugenio Hernandez-Avila Evangelina Morales Diana Molina-Vélez Lucino Ivan Espin Arellano | |
Acceso Abierto - openAccess | |
Atribución-NoComercial | |
https://riisp.insp.mx - URL | |
- - | |
Egreso hospitalario - RNCTIMX - axxaxax Hospitalización - RNCTIMX - XX Atención hospitalaria - RNCTIMX - XX Estancia hospitalaria - RNCTIMX - XX Mortalidad hospitalaria - RNCTIMX - XX Morbilidad hospitalaria - RNCTIMX - XX Causas de hospitalización - RNCTIMX - XX Causas de egreso o alta - RNCTIMX - XX días estancia - RNCTIMX - XX sector salud - RNCTIMX - XX | |
Procesamiento de Datos
Operaciones de limpieza
El equipo de la UISP descarga de la página del SINAIS las bases de datos de egresos hospitalarios setorial por año.
Se estandariza cada una de ellas y se evalúa si hay trazabilidad de variables, para dejar las bases de datos homogéneas.
Se procede a integrar las bases en la serie.
Para el procesamiento de las bases de datos, se utilizan técnicas de minería de datos. Se lleván a cabo en varias etapas que a continuación se describen:
1. Selección de bases de datos
Se seleccionaron las bases de datos que se integrarían al proyecto Defunciones (INEGI), Nacimientos (INEGI), Nacimientos (SINAC), Egresos hospitalarios (SAEH-SSA), Egresos hospitalarios sectorial, Exceso de mortalidad (INSP), Servicios otorgados(SIS), etc.
Se utilizaron técnicas de minería de datos para la limpieza y estandarización, también se llevaron a cabo procesos de calidad de acuerdo con las dimensiones de completitud, consistencia, exactitud, duplicidad e integridad para la serie de años de cada una de las bases de datos.
Se identificó en que comunidad entrarían cada una de las bases de datos de acuerdo con su clasificación.
2. Recopilación y preparación de los datos
Una vez identificadas las bases de datos, se hizo el acopio de los datos existentes a la fecha. En este paso es importante mencionar que cada año se van incorporando nuevas bases de datos de acuerdo a su año de publicación.
También se hizo la recopilación y búsqueda de documentación: soporte conceptual y metodológico, proyectos estadísticos, instrumentos de captación formularios, formatos, cuestionarios o guías para la operación del sistema de captura y descripción de archivos de la base de datos o diccionarios de datos de las variables que las conforman.
Para este proceso se hizo un análisis de integración de datos (data integration), que consiste en la recopilación de datos desde las diferentes fuentes. Esto se hace a través de un proceso ETL (Extracción(Extract), Transformación(Transform) y Carga(Load)). En este punto se decide si ciertos datos pueden ser descartados.
Para la preparación de los datos se hace una limpieza, se quitan redundancias y se buscan patrones. Luego se transforman (estandarizan) en el formato óptimo para el modelado.
Cuando existen diferencias en las variables de cada año, se integran a las bases de datos nuevas variables estandarizadas, las cuales se adecuan a las series de tiempo de cada año. En este proceso se estandarizan los catálogos de las varia - Metodología El presente trabajo es una compilación, estandarización e integración de las bases de datos de Egresos hospitalarios del sector salud y públicadas de manera anual por la Dirección General de Información en Salud (DGIS). Se presenta un periodo de descarga de 2004 al 2020, es una serie completa de registro de egresos hospitalarios del sector salud en México. Se realiza revisión de consistencia y trazabilidad de las variables en cada año para que sean homogéneas en la serie de tiempo. El objetivo principal es lograr una integración, armonización, estandarización, integración y vinculación de grandes bases de datos en México para su análisis y visualización. Cada año se mantendrá actualizada y se integrarán los años posteriores de manera que la serie de tiempo va a ir creciendo. Se lleva a cabo un proceso denominado minería de datos, con el cual, mediante un conjunto de técnicas se exploran grandes bases de datos para identificar errores o patrones en los datos. Se basa en los principios de FAIR (por sus siglas en inglés, hacen que los datos cumplan con ser fáciles de encontrar, accesibles, interoperables y reutilizables [Wikilson et al., 2016]), los cuales brindan una guía para que se puedan administrar datos científicos y que pueda garantizarse su uso. Este repositorio, es parte de un proyecto de CONACYT denominado "Sistema para el análisis espacio-temporal y visualización cuantitativa de la situación general de los principales problemas de salud, los recursos y costos, a partir de la vinculación de grandes bases de datos del sector salud en México". Gracias al apoyo y participación de varias instituciones como la Dirección General de Información en Salud (DGIS) es que se está realizando esta enorme labor. El alcance de este repositorio va más allá de proveer las bases de datos para los análisis que se requerirán en el proyecto antes mencionado. Además de esto, las pondrá al alcance de la comunidad científica, académica y de tomadores de decisiones. La información y acceso a las series de tiempo se encontrará disponible en el repositorio, el cual también puede ser consultado a través de la página de la Unidad de Inteligencia en Salud Pública (UISP): https://uisp.insp.mx/ - Resumen | |
Instituto Nacional de Salud Pública | |
2022 | |
zip | |
Español - spa | |
OTRAS - 2112 - 321299 | |
NaN | |
Conjunto de datos - Egresos | |
Appears in Collections: | Sistema de Visualización de datos en Salud |
Upload archives
File | Description | Size | Format | |
---|---|---|---|---|
1 Egresos_sectorial_2004_2012.zip | Basede datos Egresos hospitalarios 2004-2012 | 448.59 MB | ZIP | View/Open |
2 Egresos_sectorial_2013_2020.zip | Base de datos egresos hospitalarios 2013-2020 | 589.56 MB | ZIP | View/Open |
Ficha técnica - Egresos hospitalarios Sectorial salud.docx | Ficha técnica | 21.32 kB | Microsoft Word XML | View/Open |