Combinando patrones léxico-sintácticos y análisis de tópicos para la extracción automática de frases relevantes en textos

Yamel Pérez Guadarramas, Aramis Rodríguez-Blanco, Alfredo Simón-Cuevas, Wenny Hojas-Mazo, José A. Olivas Varela

Resumen


La extracción automática de palabras o frases relevantes constituye una tarea de gran importancia para muchas soluciones computacionales en el área del procesamiento de lenguaje natural y la minería de texto. En la literatura se proponen varias soluciones a esta problemática, pero aún los resultados que se reportan necesitan ser mejorados. En este trabajo se propone un método no supervisado para la extracción de frases relevantes en textos, en el cual se combina el uso de patrones léxico-sintácticos para extraer las frases candidatas con una estrategia de análisis de tópicos basada en grafo para determinar las frases relevantes. El método propuesto fue evaluado con los corpus SemEval-2010 e INSPEC y comparado con otras propuestas del estado del arte, obteniéndose resultados muy prometedores.

Texto completo:

PDF