Una aproximación supervisada para la minería de opiniones sobre tuits en español en base a conocimiento lingüístico

David Vilares , Miguel A. Alonso , Carlos Gómez-Rodríguez

Resumen


En este artículo se describe un sistema para la clasificación de la polaridad de tuits escritos en español. Se adopta una aproximación híbrida, que combina conocimiento lingüístico obtenido mediante PLN con técnicas de aprendizaje automático. Como paso previo, se realiza una primera etapa de preprocesado para tratar ciertas características del uso del lenguaje en Twitter. A continuación se extrae información morfológica, sintáctica y semántica, para utilizarla posteriormente como entrada a un clasificador supervisado. La evaluación de la propuesta se lleva a cabo sobre el corpus TASS 2012, anotado para realizar tareas de clasificación con cuatro y seis categorías. Los resultados experimentales muestran un buen rendimiento para ambos casos, lo que valida la utilidad práctica de la propuesta.

Texto completo:

PDF