Redes Neuronales para la identificación de competencias legisladas

Autores/as

  • Carlos Gabriel Oblitas Villegas Postgrado en Informática, Universidad Mayor de San Andrés

Palabras clave:

nlp, text mining, doc2vec, lda, lstm

Resumen

El modelamiento de tópicos es un campo del Procesamiento del Lenguaje Natural, que permite categorizar textos en distintos temas (tópicos), mediante algoritmos de manera supervisada y no supervisada. En la presente investigación se tratará la categorización de la normativa boliviana de los gobiernos autónomos (GA), de acuerdo a las competencias asignadas a los GA por la Constitución y la Ley Marco de Autonomías. De esta manera se utilizó word2vec para identificar el espacio semántico de los textos a clasificar y los algoritmos LDA y LSTM para el modelado de tópicos. Para mejorar los resultados obtenidos por el LDA, se buscó el número óptimo de tópicos, y se utilizó el algoritmo LDA Guiado basado en los datos de una clasificación manual previa, para extraer información significativa que permita hallar la competencia legislada en la normativa boliviana. Además, este estudio realizó una evaluación de la precisión de los algoritmos utilizados para realizar esta clasificación.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Carlos Gabriel Oblitas Villegas, Postgrado en Informática, Universidad Mayor de San Andrés

Licenciado en Informática por la Universidad Mayor de San Andrés (La Paz, 2005). Actualmente realiza la Maestría de Gerencia Estratégica de Sistemas de Información GETSI del Postgrado en Informática UMSA.
Ejerce profesionalmente en la Unidad de Análisis Económico Financiero del Servicio Estatal de Autonomías.
Publicó el artículo “Redes Neuronales para la identificación de competencias legisladas”, PGI-Review Nro 7, Postgrado en Informática UMSA, La Paz 2019.
Sus intereses investigativos incluyen Ciencia de Datos, Aprendizaje de Maquina y Procesamiento del Lenguaje Natural.
Email: oblitasss@gmail.com.

Citas

S. Durán, «Cartilla Ejercicio de Competencias,» Servicio Estatal de Autonomías, La Paz, 2012.

D. Ferati, «Text Mining in Financial Industry Implementing Text Mining Techniques on Bank Policies,» Utrecht, Netherlands, Utrecht University, 2017.

Q. Le y T. Mikolov, Distributed Representations of Sentences and Documents.

D. Andrzejewski y X. Zhu, Latent Dirichlet Allocation with Topic-in-Set Knowledge, Wisconsin: Association for Computational Linguistics, 2009.

J. Jagadeesh, D. I. Hal y U. Raghavendra, Incorporating Lexical Priors into Topic Models, Maryland: Association for Computational Linguistics, 2012.

C. Olah, «Christopher Olah's Blog,» GitHub Pages, 27 August 2015. [En línea]. Available: https://colah.github.io/posts/2015-08-Understanding-LSTMs/. [Último acceso: 15 10 2019].

Kerlinger, La investigación del comportamiento, México: Interamericana, 1979.

R. Wirth, CRISP-DM: Towards a Standard Process Model for Data, Manchester, UK: Conference on the Practical Applications of Knowledge Discovery and Data Mining, 2000.

Descargas

Publicado

2021-11-30

Cómo citar

Oblitas Villegas, C. G. (2021). Redes Neuronales para la identificación de competencias legisladas. INF-FCPN-PGI Revista PGI, (8), 41–44. Recuperado a partir de https://ojs.umsa.bo/ojs/index.php/inf_fcpn_pgi/article/view/44

Número

Sección

Artículos