Improving an automatically extracted corpus for UMLS Metathesaurus word sense disambiguation

Antonio Jimeno-Yepes , Alan R. Aronson

Resumen


Anotar a mano un conjunto de ejemplos para entrenar métodos de
aprendizaje automático para desambiguar anotaciones con conceptos del UMLS Metathesaurus no es posible debido a su elevado coste. En este artículo, evaluamos dos métodos para mejorar la calidad de un corpus obtenido de manera automática. El primer método busca términos específicos y el segundo filtra falsos positivos. La combinación de los dos métodos obtiene una mejora de 6% en F-measure y un 8% en recall, comparado con el corpus original extraído de manera automática.

Texto completo:

PDF