Aplicación de machine learning sin supervisión
Palabras clave:
Aprendizaje no supervisado, clasificación, dendogramaResumen
El presente artículo, tiene como objetivo principal el desarrollo de la aplicación de machine learning no supervisado. La aplicación de esta metodología se realiza considerando la Encuesta Sociodemográfica del Departamento de La Paz, realizada en el año 2015. La base de datos considerada tiene datos de migración, salud, educación, empleo, ingresos, agropecuaria, vivienda, etc. De esta se considera los 75 municipios del Departamento de La Paz y los indicadores educativos, empleo, demográficos y vivienda y dentro de esta se consideran: la tasa de alfabetismo, tasa de participación, distribución de hogares según disponibilidad de dormitorios y relación de masculinidad.
Los resultados muestran que los municipios Santiago de Huata, y Tito Yupanqui, muestran similares características respecto a los indicadores: tasas de participación, relación de masculinidad y tasa de alfabetismo. Otro cluster definido por la customización son los municipios Humanata, Alcapata y Ayata y son parecidos en distribución de hogares según disponibilidad de dormitorios por persona y tasa de alfabetismo. Se concluye que la customización es la mejor forma de clasificación por la forma en que se presenta en forma mucho más clara que otras formas de clasificar consideradas en el estudio.
Descargas
Citas
Berger, J. O. (1985). Statistical Decision Theory and Bayesian Analysis (2° ed.) Springer-Verlag, New York. Cambridge, MA, 1997. Mit Press.
Cristianini, N. and Shawe- Taylor, J. (2000). An Introduction to Support Vector Machines
Harig, A.L. y Fausch, K.D.(2002). Minimum habitat requirements for establishing translocated cutthroat trout populations. Ecol. Appl.12 (2): pp. 535-551.
Murphy, K.P (2012). Introduction to Support Vector Machines
Nagelkerke, N.J. (1991). A note on a general definition of the coefficient of determination. Biometrika 78: pp. 691-692.
Osuna E., Freund, R. and Girosi, F. 2007. “An Improved Training Algorithm for Support.
Platt, J.C. (1997). “Fast Training of Support Vector Machines Using Sequential Minimum.
Río, M. del; Bravo, F.; Pando, V.; Sanz, G. & Sierra, R.(2004). Influence of individual tree and stand attributes in stem straightness in Pinus pinaster Ait. Stands. Ann. Sci. For.61(2): pp. 141-148.
Shalev, S. (2014). Understanding Machine Learning: From Theory to Algorithms.
Smola, A.J. and Schölkopf, B. (2004). “A tutorial on Support Vector Regression,” Neuro COLT2.
Vaptnik, V. Golowich, S. and Smola, A. (1996). “Support vector method for function”.
Vaptnik, V. N.(1995). The nature of Statical Learning Theory, New York: Wiley.