Derechos de autor 2022 Publicaciones e Investigación

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
Cuando PUBLICACIONES E INVESTIGACIÓN recibe la postulación de un original por parte de su autor, ya sea a través de correo electrónico o postal, considera que puede publicarse en formatos físicos y/o electrónicos y facilitar su inclusión en bases de datos, hemerotecas y demás sistemas y procesos de indexación. PUBLICACIONES E INVESTIGACIÓN autoriza la reproducción y citación del material de la revista, siempre y cuando se indique de manera explícita el nombre de la revista, los autores, el título del artículo, volumen, número y páginas. Las ideas y conceptos expresados en los artículos son responsabilidad de los autores y en ningún caso reflejan las políticas institucionales de la UNAD
Tecnología de Big Data en el análisis del estado de la pandemia por covid-19 en Colombia
En la actualidad de la pandemia, se presenta la necesidad de procesar grandes volúmenes de información generados por casos reportados positivos, con el fin de identificar patrones que conlleven a afrontar la emergencia con medidas de contingencia oportunas. En el presente estudio se plantea el tratamiento de un data set de la población general de Colombia, con información comprendida del mes de marzo y abril del 2021, con el fin de caracterizar, georreferenciar y predecir para darle valor a los datos, en busca de una comprensión de la dinámica del virus, para lo que se utilizaron tres modelos Naive Bayes, Random Forest y árboles J-48, buscando identificar aquel con mayor precisión; al usar el aplicativo Weka se llega a la conclusión de que el modelo que mejor se ajusta a la predicción, es el algoritmo de clasificación de árboles J-48 con un nivel de clasificación de instancias correctas de 99.24%, con un valor de Kappa de 0.9266 informando que se aproxima al 100 % de concordancia en la clasificación de las clases, con una cantidad, para este caso, de estudio de 221.583 clases y la predicción con 30 clases tomadas de la base original que consta de aproximadamente 2.774.465 datos. Al aplicar pruebas estadísticas se logra identificar la correlación entre los atributos, que llevan a garantizar el correcto modelado para la predicción. Este proceso se convierte en un insumo potencial para apoyar los procesos de administración de la sociedad y que beneficie las decisiones que se toman en términos de salud pública.