Typesetting
in Revista de Investigación Agraria y Ambiental
Elaboración de unmodelo neuronal artificial para la estimación de la demanda bioquímica deoxígeno en aguas marinas
Resumen
Contextualización: los modelos neuronales artificiales son modelos diseñados a partir de métodos numéricos denominados Redes Neuronales Artificiales. El uso de estos, como herramienta de predicción de la Demanda Bioquímica de Oxígeno (DBO), ha demostrado diversas ventajas, entre otras, la reducción del tiempo y los costos económicos asociados a este parámetro. La DBO generalmente requiere de 5 a 7 días, así como múltiples reactivos químicos, para poder establecer los niveles de materiales orgánicos en las aguas.
Vacío de investigación: los modelos neuronales artificiales permiten calcular la DBO en tiempo real, a partir de variables fisicoquímicas registradas in situ. A pesar de ello, las redes neuronales artificiales no han sido utilizadas hasta ahora como método de estimación de la DBO en aguas marinas de Colombia.
Propósito del estudio: teniendo en cuenta este aspecto, en la presente investigación se elaboró un modelo neuronal artificial que permite estimar la DBPO en aguas del Mar Caribe Colombiano.
Metodología: para elaborar el modelo fue necesario realizar cinco simulaciones (constituidas por un número de 2 a 3 capas ocultas, y de 5 a 20 neuronas por capa). El desempeño predictivo de cada una de estas se evaluó a través del coeficiente de correlación.
Resultados y conclusiones: los valores más altos de este indicador estadístico (0,937, 0,951, 0,953, y 0,941), se obtuvieron para el modelo que utilizó 3 capas, de 20 neuronas cada una, en sus cuatro etapas de aprendizaje (entrenamiento, validación, prueba, y todos los datos). Estas cifras indican un cercano ajuste entre los datos observados y las estimaciones hechas por la red. Estos resultados demuestran además que la Demanda Bioquímica de Oxígeno puede ser estimada numéricamente, en aguas marinas, a través de modelos neuronales artificiales.
Main Text
1. INTRODUCCIÓN
La demandabioquímica de oxígeno (DBO) es un parámetro que representa la cantidad deoxígeno disuelto en el agua que es consumido o “demandado” por microorganismosdurante la degradación de compuestos orgánicos (APHA, 2005). Esta,es también una medida indirecta del contenido de sustancias orgánicasbiodegradables presentes en una muestra de agua (Matos et al., 2014). Laestimación experimental de este parámetro generalmente requiere un periodo de 5a 7 días (y en algunos casos, de 20 a 25 días), el uso de múltiples reactivosquímicos, y el empleo de personal capacitado en el manejo de estas sustancias (APHA, 2005; Simon et al., 2011; Tachibana et al., 2013).Con el fin de reducir el tiempo y los costos económicos que este procedimientoinvolucra, en la última década, se han propuesto diversos métodos numéricos comoalternativas de estimación de la DBO (Abyaneh, 2014).Dentro de estos, se han usado, para tal fin, estimaciones usando Redes Neuronales Artificiales (RNA), delas cuales se han obtenido resultados de predicción mejores a los obtenidos conotros modelos matemáticos convencionales y de regresión estadística (Tomenko et al., 2007; Dogan et al., 2014),los cuales se han aplicado para aguas continentales, siendo aún objeto deexploración, la estimación del parámetro usando las herramientas basadas en redesneuronales para aguas marinas (Meza, 2019). Considerandolos anteriores aspectos, en este estudio, se propuso la elaboración de unmodelo neuronal para la estimación de la DBO en aguas marinas del Departamentode Bolívar (Colombia). Para comprender la forma en que fue elaborado estemodelo, a continuación, se describen algunos de los conceptos más relevantes.
Demanda bioquímica de oxígeno
La DBO es un procesode tipo biológico y químico en el cual los materiales orgánicos constituidospor carbono (CxHyOz),y los compuestos nitrogenados provenientes de la hidrólisis de las proteínas(NH3, NO2ˉ) se oxidan en presencia de microorganismos (Phu, 2014):
El oxígeno consumido en estas reacciones (generalmente expresado en mg/L) puede ser cuantificado experimentalmente a través de un procedimiento en el que se replican las condiciones ambientales del proceso. La guía Standard Methods for the Examination of Water and Wastewater, en su sección 5210, describe el protocolo utilizado comúnmente para estimar la DBO en laboratorio (APHA, 2005). Debido a que este procedimiento se fundamenta en las reacciones de consumo de oxígeno para aguas continentales, diversos investigadores consideran que este puede ser inadecuado para la determinación de la DBO en aguas marinas o bajo condiciones extremas de temperatura (Howington et al., 1994; Simon et al., 2011; Matos et al., 2014).
En los mares, la demanda bioquímica de oxígeno se origina por la descomposición de los compuestos orgánicos derivados de la fotosíntesis del fitoplancton, así como en la oxidación de la materia orgánica proveniente de los ríos y áreas urbanas (Tuchkovenko & Lonin, 2003; INVEMAR, 2016). La DBO en las aguas marinas puede atribuirse también a una disminución del oxígeno producido por microalgas, o a una reducción del O2 soluble procedente del aire (Naimpally y Rosselot, 2014). Normalmente, en áreas marinas naturales, como los arrecifes de coral y bosques de manglar, la DBO no suele sobrepasar los 2 mg/L (Simon et al., 2011; Gandaseca et al., 2016; Severiche et al., 2017). Sin embargo, es posible encontrar demandas mucho más altas (>11.800 mg/L), en zonas costeras contaminadas por aguas residuales, o destinadas a la acuacultura y a la actividad pesquera (Muthukumaran & Baskaran, 2013; CARDIQUE, 2017).
En Colombia, se estima que anualmente las aguas marinas reciben cerca de 34.633 toneladas de materia orgánica biodegradable (en forma de DBO), desde los municipios costeros, y alrededor de 971.856 toneladas desde sus sistemas fluviales más importantes (INVEMAR, 2016). De estos últimos, el Mar Caribe recibe aproximadamente unas 954.465 toneladas anuales, es decir, un 98% de las cargas totales de la nación (INVERMAR, 2016). Debido a ello, la costa Caribe colombiana es una de las zonas que mayor atención requiere en relación al manejo de este tipo de sustancias.
Redes neuronales artificiales
Las redes neuronales artificiales, son técnicas matemáticas que imitan la estructura y comportamiento de las redes de neuronas biológicas (Barthakur et al., 2012). Generalmente, una red de neuronas artificiales se encuentra conformada por tres estructuras o niveles de procesamiento de información denominados “capas”. En el primer nivel, la “capa de entrada”, se reciben los datos de las distintas variables independientes del modelo. En el segundo nivel o “capa oculta”, se procesa y transfiere la información proveniente de la capa de entrada a las capas adyacentes. En el último nivel, la “capa de salida”, se generan los resultados del modelo (Singh et al., 2009; Araghinejad, 2014). Cada una de estas capas se encuentra constituida por un conjunto de subestructuras denominadas neuronas (Singh et al., 2009). Dichas neuronas utilizan un número real para la ponderación de los valores de entrada denominado “peso”, así como una función matemática para la normalización de los datos llamada “función de transferencia” (Palani et al., 2008).
Para encontrar el patrón que más se ajusta a la respuesta deseada, una red neuronal artificial lleva a cabo un proceso denominado aprendizaje o entrenamiento. En él, la red identifica una combinación óptima de pesos que asegura que las salidas del modelo sean cercanas a las observaciones (Palani et al., 2008). Los datos del problema a resolver, que son usados durante esta fase se denominan conjunto de entrenamiento. En la práctica, junto con este, suelen usarse dos conjuntos de datos denominados conjunto de prueba y conjunto de validación, los cuales son utilizados para medir el desempeño de la red y garantizar que no hayan sobreajustes en las estimaciones (Raoufy et al., 2011).
Como parte de su entrenamiento, las RNA requieren además que el número de sus capas ocultas, y la cantidad de neuronas presentes en ellas, se modifiquen hasta obtener una combinación óptima de estas. Debido a que en el campo de la modelación neuronal no existen reglas estrictas para establecer el número adecuado de capas y neuronas en una red, usualmente, este proceso es realizado por medio de ensayo y error, o según el criterio del investigador (Tomenko et al., 2007).
En la práctica, el uso de las RNA ha demostrado ser una herramienta útil de estimación de la DBO y otros parámetros de calidad del agua (Abyaneh, 2014; Emamgholizadeh et al., 2014). Es por ello que este estudio tiene como principales objetivos: (a) elaborar cinco modelos neuronales de DBO con distinto número de neuronas; (b) calcular sus respectivos desempeños predictivos por medio de un indicador estadístico; y (c) establecer el modelo más adecuado a través de la comparación de los valores de este indicador.
2. MATERIALES Y MÉTODOS
Área de estudio
El estudio se llevó acabo en aguas marinas del Departamento de Bolívar (Colombia). La recolección delas muestras de agua fue realizada por la CorporaciónAutónoma Regional del Canal del Dique (CARDIQUE), en 32 estaciones demonitoreo. Estas estaciones se encuentran localizadas entre el corregimiento deGalerazamba, al norte de Bolívar (10°47'20.19"N 75°15'50.74"W),y la desembocadura del Caño Correa, al sur de la costa de este departamento (10°3'28.52"N75°27'27.03"W).―La ubicación de las estaciones de calidaddel agua puede consultarse en CARDIQUE (2017) e INVEMAR (2017)―.
Estimación experimental de las variables
Los parámetrosfisicoquímicos usados en esta investigación (sólidos suspendidos totales,salinidad, pH, oxígeno disuelto, y DBO) fueron registrados por CARDIQUE, entre los años 2011 y 2014. Laestimación experimental de éstos se hizo de acuerdo a la Edición 22 de la guía Standard Methods for the Examination of Water and Wastewater siguiendo el protocolo 4500-O-G método delelectrodo de membrana para el oxígeno disuelto; el protocolo 4500-H+-BMétodo electrométrico para el potencial de hidrógeno; el protocolo 2520-BMétodo de conductividad eléctrica para la salinidad; el protocolo 2540-D paralos sólidos suspendidos totales; y los protocolos 5210-B Prueba de DBO 5-días y4500-O-G, para la DBO (APHA, 2005). Untotal de 345 registros de cada parámetro fueron utilizados para la elaboracióndel modelo.
Elaboración del modelo neuronal de DBO
El modelo neuronal para la predicción de la demanda bioquímica de oxígeno, se elaboró a partir de una red tipo Perceptrón Multicapa (PMC) (ver Anexo y Araghinejad (2014)). En este, se usó la DBO como variable de salida, mientras que el oxígeno disuelto (OD), el potencial de hidrógeno (pH), la salinidad (Sal), los sólidos suspendidos totales (SST), y las coordenadas geográficas de cada estación de monitoreo (Lat―Long), se usaron como entradas (Figura 1). La selección de estos parámetros se hizo con base en su influencia sobre el proceso de demanda bioquímica de oxígeno y teniendo en cuenta la frecuencia con que han sido usados en estudios previos (Šiljić et al., 2016; Meza, 2019).
Por su parte, el código para el entrenamiento del PMC se elaboró a partir del modelo desarrollado por González et al. (2012). En este, el PMC es entrenado por medio del número de capas ocultas y el número de neuronas ocultas. Además, requiere definir un algoritmo para el entrenamiento de la red (que permite acelerar el proceso de aprendizaje del PMC), un número de épocas (la cantidad de veces que el algoritmo de entrenamiento es aplicado al conjunto de datos), un indicador de desempeño (por medio del cual la red ajusta las predicciones a las observaciones), y un método para la partición del conjunto de datos (división aleatoria, por bloques, intervalos, o índices). Este código se encuentra escrito en el lenguaje de programación “M” y en él se hizo uso de las herramientas disponibles en el “Neural Network Toolbox” del software MATLAB® (Beale et al., 2015; Meza, 2019).
En la Tabla 1 se presentan los 5 modelos (o arquitecturas) del perceptrón que fueron usados en la investigación. Estos modelos constan de entre 2 a 3 capas ocultas, y desde 5 hasta 20 neuronas ocultas por capa. En cada modelo, el número de neuronas de la capa de entrada (6 neuronas), correspondió al número de variables usadas como entradas. Para su entrenamiento, se usó un número de 100 épocas y la suma de los errores cuadráticos (SSE) como indicador de desempeño. (La función de este último indicador estadístico es distinta a la del indicador usado para validar los resultados del modelo. Para ello véase el anexo al final del artículo).
Los modelos fueron evaluados por medio del algoritmo de Levenberg-Marquardt (ver anexo), el cual, según Zayani et al. (2008), Mustafa et al. (2012), Ebtehaj & Bonakdari (2016), y Meza (2019), posee un desempeño predictivo superior al de otras metodologías de entrenamiento del PMC y, de acuerdo con Singh et al. (2009) y Meza (2019), es el algoritmo más adecuado para hacer estimaciones de la DBO.
Por su parte, elmétodo usado para dividir el conjunto de datos fue de tipo aleatorio (dividerand).Este último divide el conjunto de observaciones en cuatro subconjuntos(llamados entrenamiento, validación,prueba, y todos los datos) y asigna aleatoriamente a cada uno de ellos unporcentaje del total de datos (70%, 15%, 15%, y 100%, respectivamente).
Análisis estadístico
Parapoder comprobar la efectividad de cada modelo como método de estimación de laDBO, fue necesario aplicar un indicador estadístico al final de las distintasetapas del aprendizaje. Unade las pruebas estadísticas que se usan comúnmente en la evaluación deldesempeño de las redes neuronales artificiales es el coeficiente de correlación (R):
En la ecuación anterior, n es el número total de observaciones; Xi y Yi son los valores observados y estimados, respectivamente. e son los valores promedio de todas las observaciones X y estimaciones Y (Abyaneh, 2014). Un R igual a 1, indica un ajuste perfecto entre los resultados del modelo y los valores de DBO observados. Mientras que un R igual a cero, o negativo describe una correlación nula entre la predicción y la observación de la DBO (Gulyani et al., 2015).
Este indicador de desempeño se encuentra incluido en los códigos del PMC y sus valores fueron calculados de manera automática luego del entrenamiento. Además, fue usado como criterio de comparación de las distintas arquitecturas de la red. El modelo con el cual se obtuvieron los valores más altos del coeficiente de correlación (calculados de manera simultánea para las cuatro fases del aprendizaje), fue elegido como el más adecuado para hacer estimaciones de la DBO.
3. RESULTADOS Y DISCUSIÓN
En la Tabla 2 puedeverse que la red Perceptrón multicapa, entrenada con el algoritmo deLevenberg-Marquardt, presentó valores del coeficiente de correlación entre 0,716y 0,953. Sus cifras más bajas de R fueron calculadas en el modelo 1 (0,830entrenamiento, 0,716 validación, y 0,806 todos), y el modelo 2 (0,775 prueba),mientras que los valores más altos se calcularon para todas las etapas deaprendizaje del modelo 4 (0,916, 0,907, 0,927, y 0,914), y el modelo 3 (0,937,0,951, 0,953, y 0,941). Debido a que este último obtuvo los R más altos detodas las simulaciones (en todas sus fases de aprendizaje y simultáneamente),fue seleccionado como el modelo más adecuado para calcular la demandabioquímica de oxígeno.
En la tabla puede verse también que los valores de R se incrementaron gradualmente con el aumento en el número de neuronas ocultas (lo cual indicaría una posible influencia de la complejidad de la red sobre el desempeño predictivo de la misma); sin embargo, este comportamiento no se observó durante la fase de prueba posiblemente por el uso de la división aleatoria del conjunto de datos (Águila-Martínez, 2017).
Pese a estos óptimos resultados, debe tenerse en cuenta que el número de neuronas y capas ocultas no guarda relación con la DBO pues, para realizar sus cálculos, los modelos neuronales no utilizan ecuaciones que describan el proceso de demanda bioquímica de oxígeno (Emamgholizadeh et al., 2014). En este tipo de modelos, las neuronas solo representan un segmento de la función matemática que la red construye a partir del conjunto de observaciones.
4. CONCLUSIONES
Se demostró que los modelos elaborados con redes neuronales artificiales se pueden usar para la estimación de la DBO en aguas marinas. La red neuronal utilizada en el diseño de estos modelos (el Perceptrón multicapa), alcanzó un alto desempeño al ser entrenada con el algoritmo de Levenberg-Marquardt (R > 0,9). Al utilizar este último, en conjunto con 60 neuronas y tres capas ocultas, se obtuvieron los desempeños más altos del estudio.
A fin de dar mayor validez a los resultados obtenidos en este estudio, se recomienda llevar a cabo investigaciones en otras regiones costeras de Colombia, así como utilizar el modelo en situaciones reales (en el cálculo de datos faltantes de DBO, por ejemplo). También se sugiere que se utilicen bases de datos de mayor tamaño en el desarrollo de nuevos modelos, pues esto permite mejorar el desempeño predictivo de las RNA.
En la actualidad, las redes neuronales artificiales poseen un amplio campo de investigación y desarrollo. Este es otro motivo para seguir realizando estudios sobre modelación neuronal de la demanda bioquímica de oxígeno. A futuro se espera que se puedan usar los modelos neuronales de DBO en tiempo real, y que su uso llegue a ser una alternativa a los métodos convencionales de estimación de la DBO.
Resumen
Main Text
1. INTRODUCCIÓN
Demanda bioquímica de oxígeno
Redes neuronales artificiales
2. MATERIALES Y MÉTODOS
Área de estudio
Estimación experimental de las variables
Elaboración del modelo neuronal de DBO
Análisis estadístico
3. RESULTADOS Y DISCUSIÓN
4. CONCLUSIONES