QuarryMeaning: Una aplicación para el modelado de tópicos enfocado a documentos en español

Olga Acosta, César Aguilar, Fabiola Araya

Resumen


Esta demostración presenta una aplicación standalone que permite entrenar y probar un modelo de tópicos. Tal aplicación considera filtros para reducir ruido en los resultados. Así, por una parte, se incluye una lista de palabras base no relevantes que se puede complementar con otros vocabularios, ya sean propuestos por el usuario, o bien obtenidos mediante un enfoque comparativo usando un corpus de referencia. Por otro lado, es posible considerar únicamente las palabras que tienen un valor semántico alto usando etiquetas de partes de la oración. Además, se incluye un despliegue visual de nubes de palabras que muestra los primeros 10 tópicos derivados del entrenamiento, con el objetivo de explorar visualmente los resultados. Finalmente, se realizó la evaluación de la herramienta considerando una tarea de clasificación de documentos. El modelo logró niveles de precisión superiores al 95% en el conjunto de prueba.

Texto completo:

PDF


DOI: http://dx.doi.org/10.26342/2018-61-31