PREDICCIÓN Y CLASIFICACIÓN DEL RENDIMIENTO ACADÉMICO A TRAVÉS DE MÉTODOS DE MACHINE LEARNING: REGRESIÓN LOGÍSTICA Y ÁRBOL DE DECISIONES
Palabras clave:
Machine learning, regresión logística, árbol de decisiones, rendimiento académicoResumen
El objetivo principal de este trabajo de investigación es evaluar métodos de Machine Learning: regresión logística y árbol de decisiones para la predicción del rendimiento académico considerando diferentes variables sociodemográficas, académicas, económicas y otras, con base en registros de la gestión 2022 de la Escuela Militar de Ingeniería (E.M.I.), departamento de Ciencias Básicas. Los resultados obtenidos muestran que el método más preciso respecto a las métricas obtenidas (precisión, recall, especificidad, F1- score y otros) es el método de regresión logística con ajuste de hiperparámetros con validación cruzada con una precisión del 90.38%. El método del árbol de decisiones mostró tener una baja precisión con 47.81%. Para mejorar estas métricas se analizaron: el árbol de decisiones con ajuste de hiperparámetros, el Random Forest y el Random Forest con ajuste de hiperparámetros, siendo este último el que mostró las métricas mejoradas (54.6% de precisión). Los resultados obtenidos a partir del análisis de los métodos propuestos, servirán para identificar a los estudiantes en riesgo de bajos rendimientos y la toma de decisiones para evitar la posible deserción estudiantil.
Referencias
Damián, A., Jiménez Alfaro, J. V., y Díaz Ospina, O. (2021). Revisión sistemática de literatura: Técnicas de aprendizaje automático (Machine Learning). Activa, (1), 113-121.
Herreño M., M., Romero T., J., Mejía R., J., y Roman S., W. (2024). Deserción estudiantil en educación superior. Tendencias y oportunidades en la era post pandemia. Koinonia, 8(X). [Número de volumen y artículo específico necesitan verificación].
Medina Merino, F. R., y Ñique Chacón, C. (2017). Bosques aleatorios como extensión de los árboles de clasificación con los programas R y Python. Interfaces. https://www.kaggle.com/primaryobjects
Ocaña Fernández, Y. (2011). Variables académicas que influyen en el rendimiento académico de los estudiantes universitarios. Investigación Educativa, 15 (1), 165-179.
Ochoa Sangrador, C., Molina Arias, M., y Ortega Páez, E. (2023). Regresión logística múltiple. Evidencias en Pediatría. http://www.evidenciasenpediatria.es
Poveda V., I. (2019). Los factores que influyen sobre la deserción universitaria. Estudio en la UMRPSFXCh – Bolivia, análisis con ecuaciones estructurales. REV.INV.&NEG, 12 (1), 61-77.
UNESCO. (2024). PISA 2022 El panorama de los países de América Latina y el Caribe. https://www.unesco.org/es/open-access/cc-sa
Vakaruk, S. (2023). Contribuciones a la aplicación de machine learning en escenarios novedosos de tiempo real [Tesis doctoral, Universidad Politécnica de Madrid].
Vargas, P. D. (2021). Modelo de detección de botnets en el tráfico del sistema de nombres de dominio de la red, basado en aprendizaje de máquina para banca central en Bolivia [Tesis de pregrado, Universidad Mayor de San Andrés].
Zabarte, M. G. (2022). Utilización de técnicas de aprendizaje automático para la predicción del rendimiento de los jugadores de fútbol [Tesis de maestría, Universidad Politécnica de Madrid].
