Redes Neuronales para la identificación de competencias legisladas
Palabras clave:
nlp, text mining, doc2vec, lda, lstmResumen
El modelamiento de tópicos es un campo del Procesamiento del Lenguaje Natural, que permite categorizar textos en distintos temas (tópicos), mediante algoritmos de manera supervisada y no supervisada. En la presente investigación se tratará la categorización de la normativa boliviana de los gobiernos autónomos (GA), de acuerdo a las competencias asignadas a los GA por la Constitución y la Ley Marco de Autonomías. De esta manera se utilizó word2vec para identificar el espacio semántico de los textos a clasificar y los algoritmos LDA y LSTM para el modelado de tópicos. Para mejorar los resultados obtenidos por el LDA, se buscó el número óptimo de tópicos, y se utilizó el algoritmo LDA Guiado basado en los datos de una clasificación manual previa, para extraer información significativa que permita hallar la competencia legislada en la normativa boliviana. Además, este estudio realizó una evaluación de la precisión de los algoritmos utilizados para realizar esta clasificación.
Descargas
Citas
S. Durán, «Cartilla Ejercicio de Competencias,» Servicio Estatal de Autonomías, La Paz, 2012.
D. Ferati, «Text Mining in Financial Industry Implementing Text Mining Techniques on Bank Policies,» Utrecht, Netherlands, Utrecht University, 2017.
Q. Le y T. Mikolov, Distributed Representations of Sentences and Documents.
D. Andrzejewski y X. Zhu, Latent Dirichlet Allocation with Topic-in-Set Knowledge, Wisconsin: Association for Computational Linguistics, 2009.
J. Jagadeesh, D. I. Hal y U. Raghavendra, Incorporating Lexical Priors into Topic Models, Maryland: Association for Computational Linguistics, 2012.
C. Olah, «Christopher Olah's Blog,» GitHub Pages, 27 August 2015. [En línea]. Available: https://colah.github.io/posts/2015-08-Understanding-LSTMs/. [Último acceso: 15 10 2019].
Kerlinger, La investigación del comportamiento, México: Interamericana, 1979.
R. Wirth, CRISP-DM: Towards a Standard Process Model for Data, Manchester, UK: Conference on the Practical Applications of Knowledge Discovery and Data Mining, 2000.
Descargas
Publicado
Cómo citar
Número
Sección
Licencia
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.
Distribución - Ajustes de distribución - Licencia - Términos de la licencia