Tecnología de Big Data en el análisis del estado de la pandemia por covid-19 en Colombia

Jorge Luis  Quintero López; Andrés  Arismendi Ramírez; Ángela Liceth  Pérez Rendón

doi:10.22490/25394088.5612

Vol. 15 Núm. 4 (2021): Número Especial

Publicado 15-12-2021

Licencia

Derechos de autor 2022 Publicaciones e Investigación

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.

Cuando PUBLICACIONES E INVESTIGACIÓN recibe la postulación de un original por parte de su autor, ya sea a través de correo electrónico o postal, considera que puede publicarse en formatos físicos y/o electrónicos y facilitar su inclusión en bases de datos, hemerotecas y demás sistemas y procesos de indexación. PUBLICACIONES E INVESTIGACIÓN autoriza la reproducción y citación del material de la revista, siempre y cuando se indique de manera explícita el nombre de la revista, los autores, el título del artículo, volumen, número y páginas. Las ideas y conceptos expresados en los artículos son responsabilidad de los autores y en ningún caso reflejan las políticas institucionales de la UNAD

Artículo de Investigación

Tecnología de Big Data en el análisis del estado de la pandemia por covid-19 en Colombia

DOI: https://doi.org/10.22490/25394088.5612

Jorge Luis Quintero López

Andrés Arismendi Ramírez

Ángela Liceth Pérez Rendón

PDF

Resumen
Referencias

En la actualidad de la pandemia, se presenta la necesidad de procesar grandes volúmenes de información generados por casos reportados positivos, con el fin de identificar patrones que conlleven a afrontar la emergencia con medidas de contingencia oportunas. En el presente estudio se plantea el tratamiento de un data set de la población general de Colombia, con información comprendida del mes de marzo y abril del 2021, con el fin de caracterizar, georreferenciar y predecir para darle valor a los datos, en busca de una comprensión de la dinámica del virus, para lo que se utilizaron tres modelos Naive Bayes, Random Forest y árboles J-48, buscando identificar aquel con mayor precisión; al usar el aplicativo Weka se llega a la conclusión de que el modelo que mejor se ajusta a la predicción, es el algoritmo de clasificación de árboles J-48 con un nivel de clasificación de instancias correctas de 99.24%, con un valor de Kappa de 0.9266 informando que se aproxima al 100 % de concordancia en la clasificación de las clases, con una cantidad, para este caso, de estudio de 221.583 clases y la predicción con 30 clases tomadas de la base original que consta de aproximadamente 2.774.465 datos. Al aplicar pruebas estadísticas se logra identificar la correlación entre los atributos, que llevan a garantizar el correcto modelado para la predicción. Este proceso se convierte en un insumo potencial para apoyar los procesos de administración de la sociedad y que beneficie las decisiones que se toman en términos de salud pública.

Palabras clave: predicción, machine learning, Sars-Cov-2, cuarentena

Kloeckner, J., Sansonowicz, T. K., Rodrigues, Á. L., & Nunes, T. W. N. (2020). Multi-categorical classification using deep learning applied to the diagnosis of gastric cancer. Jornal Brasileiro de Patologia e Medicina Laboratorial, 56, 1–8. https://doi.org/10.5935/1676-2444.20200013

Matilde, M., Lorenzo, G., Ramón-Hernández, A., Bello- García, B., & Caballero, Y. (2020). Adquisición de conocimiento sobre la letalidad de la COVID-19 mediante técnicas de inteligencia artificial. Anales de la Academia de Ciencias de Cuba, 10(3), 1–12.

Medina-Mendieta, J., Cortés-Cortés, E., Cortés-Iglesias, M., Pérez-Fernández, A., & Manzano-Cabrera, M. (2020). Estudio sobre modelos predictivos para la COVID-19 en Cuba. MediSur, 18(3), 431–442.

Licencia

Cómo citar

Quintero López, J. L. ., Arismendi Ramírez, A. ., & Pérez Rendón, Ángela L. . (2021). Tecnología de Big Data en el análisis del estado de la pandemia por covid-19 en Colombia. Publicaciones E Investigación, 15(4). https://doi.org/10.22490/25394088.5612

Descargar cita

Almétricas