Detección de menciones anidadas basada en expansión para el español

Marcel Puchol-Blasco , Patricio Martínez-Barco

Resumen


La detección de menciones es el primer módulo utilizado en los sistemas de resolución de la correferencia. Debido a que los errores
se van acarreando de un módulo a otro, es importante que los resultados obtenidos por este módulo sean los mejores posibles. Dentro del campo de
la detección de menciones, las menciones anidadas son las más difíciles de detectar. En este artículo presentamos un sistema de detección de
menciones anidadas basado en expansión, un nuevo modelo de detección de elementos de Procesamiento de Lenguaje Natural anidados basado en
aprendizaje automático. Los resultados
obtenidos por nuestro sistema son superiores al 72% de medida-F en el corpus AnCora. No podemos comparar directamente nuestros resultados con otros sistemas debido
a que no existen como tales, pero si comparamos la medida-F media obtenida por otros sistemas en la detección de todo tipo de
menciones (no solo menciones anidadas), y que nosotros estamos tratando con las menciones más difíciles, conseguimos resultados favorables.

Texto completo:

PDF