Machine Learning: Comparison of Algorithms for Determining Water Quality in the Rímac River

Título traducido de la contribución: Aprendizaje automático: comparación de algoritmos para determinar la calidad del agua en el río Rímac

Juan Marroquin-Peralta, Yvan Jesus Garcia Lopez, Jose Antonio Taquia

Producción científica: Contribución a una revistaArtículo (Contribución a Revista)revisión exhaustiva

Resumen

La evaluación de la calidad del agua en los ríos es necesaria para gestionar la eficiencia de su uso, siendo necesario realizar análisis físico-químicos y biológicos para determinar su salubridad, pero implica en su determinación de una serie de parámetros que utilizan diversos métodos analíticos. que a menudo son tediosos y requieren mucho tiempo para calcularlos. El presente estudio hace una comparación de modelos de aprendizaje automático como Regresión lineal múltiple (MLR), Retropropagación de redes neuronales (BPNN) y Regresión de vectores de soporte (SVR) para estimar el oxígeno disuelto (DO) y la demanda bioquímica de oxígeno (DBO) para determinar la calidad. del agua del río Rímac. Se recolectaron muestras de agua de 26 estaciones y fuentes difusas de contaminación a lo largo del río Rímac con 624 registros realizados durante los años 2010 a 2012. Los parámetros físicos y químicos introducidos en los modelos incluyen pH, turbidez, sólidos disueltos totales, temperatura, electricidad. conductividad, oxígeno disuelto, demanda bioquímica de oxígeno, demanda química de oxígeno, dureza, cloruro, sulfato, calcio, magnesio y nitrato. Las variables dependientes de los modelos de salida incluyen la demanda bioquímica de oxígeno (DBO) y el oxígeno disuelto (OD). Las variables independientes que se seleccionaron para la DBO, estas fueron: pH, CE, turbidez, Nitritos, TOC, DQO, hierro y cloruros. Para DO, fueron temperatura, Nitritos, DQO, Nitratos, STD, Cloruros y Sólidos Totales. Ambos parámetros dependientes tienen 8 variables independientes y los valores de coeficiente de correlación más altos. Los modelos fueron entrenados para el aprendizaje y la validación del 70% y 30% del conjunto de datos, respectivamente. El BPNN presentado para la estimación de DBO, con 16 nodos ocultos, valores de R2 = 0.857 para entrenamiento y 0.481 para la fase de prueba; Para la estimación de OD, con 8 nodos ocultos, este fue R2 = 0,768 en la fase de entrenamiento y prueba de 0,605. Estos valores fueron más altos que el MLR y SVR, lo que mostró que el BPNN fue la mejor selección. Finalmente, la clasificación de la calidad del agua como Buena, Regular y Mala obtuvo una precisión de 0.88 con una sensibilidad de 0.86 y un puntaje f1 de 85%, lo que evidenció su efectividad al realizar este proceso.
Título traducido de la contribución Aprendizaje automático: comparación de algoritmos para determinar la calidad del agua en el río Rímac
Idioma originalInglés
PublicaciónTurkish Journal of Computer and Mathematics Education Vol.12 No.12 (2021), 552-572
Volumen12
N.º12
EstadoPublicada - 21 may. 2021

Palabras Clave

  • Calidad del agua
  • red neuronal artificial
  • regresión lineal múltiple
  • regresión de vectores de soporte
  • río Rímac

Huella

Profundice en los temas de investigación de 'Aprendizaje automático: comparación de algoritmos para determinar la calidad del agua en el río Rímac'. En conjunto forman una huella única.

Citar esto