Árbol de Decisión en Aprendizaje Automático
Palabras clave:
Machine Learning, minería de datos, árbol de decisión, clasificación, entropía, análisis masivo de datosResumen
Los árboles de decisión son modelos de clasificación y regresión empleados en el aprendizaje automatizado o también denominado Machine Learning de uso en grandes cantidades de datos estadísticos como parte de lo que hoy es la Ciencia de Datos y el Big Data.
En este artículo se describe la metodología y se analiza los resultados que arroja el árbol de decisión de clasificación, con uso de variables de la encuesta de hogares, como: género, nivel educativo, ocupación e ingreso en ciudades capitales de Bolivia. Como conclusión, se puede observar que las mujeres están en menor desventaja que los hombres en cuanto a su nivel de formación educativa que influye en la ocupación y el ingreso.
Descargas
Citas
Bouza, C., Santiago A. Classification and Regresssion Trees. Universidad de La Habana, Cuba y Universidad Autónoma de Guerrero, México.
Breiman, L., Friedman, J.H., Olsen, R. A. & Stone, C. J. (1984). Classification and Regresssion Trees. Wadsworth, N. York.
Cox, D. R., Snell, E. J. (1989). The Analysis of Binary Data. Chapman and Hall. London.
De la Fuente, F, S. (2011), Análisis de conglomerados. Universidad Autónoma de Madrid (UAM).
Diaz, L. (2012). Análisis Estadístico de Datos Multivariantes. Universidad Nacional de Colombia.
Francois, H. (2013). Análisis de Datos con R. Colombia. Escuela Colombiana de Ingeniería.
Hair, J, F., Anderson, R, E., Tatham, R, L. & Black, W,C. (1999). Análisis Multivariante. Madrid, España. Editorial Prentice Hall.
Hosmer, D. W. & Lemeshow, S. (1989). Applied Logistic Regression. Wiley Interscience. New York.
Aldás, J. & Uriel, E. (2017). Análisis Multivatiante Aplicado con R. Alfacentauro.
Johnson, R. A. Applied Multivariate Statistical Analysis. Prentice Hall. New Jersey.
López, A. (2012). Análisis Multivariante para la Inteligencia de Mercados. Tecnológico de Monterrey.
Ruiz, M. (2013). Árboles de Decisión y ELECTRA I. Biblioteca Universitaria.
Mitchell, T. M. (1997). Machine Learning. Texto: McGraw-Hill, Cap. III. Web: http://www.cs.cmu.edu/~tom/mlbook.html
Muller, A. & Guido, S. (2016). Introduction Machine Learning with Python. Jupyter
Loyola, O. (2012). Inducción de Árboles de Decisión. Academia Española.
Theobald, O. (2018). Machine Learning for Absolute Beginners. Andriy Burkov
Peña, D. (2002). Análisis de Datos Multivariantes. McGraw Hill.
Pérez, C. (2004). Técnicas de Análisis Multivariante de Datos. Pearson Educación S.A., España.
Poole, D. (1998). Al Computational Intelligence. A Logical Approach. Oxford University Press.
Uriel, E. & Aldás, J. (2005). Análisis Multivariante Aplicado. Madrid, España. Thomson.