Evaluación de la Extracción de Entidades Nombradas de OpenCalais en castellano

Raquel Toribio , Paloma Martínez , César de Pablo-Sánchez

Resumen


En los últimos años se han popularizado herramientas de Extracción de
Información comerciales dentro del ecosistema de servicios de la Web Semántica.
OpenCalais ofrece actualmente reconocimiento y categorización de Entidades Nombradas
en castellano de fácil integración en aplicaciones de PLN. Hemos evaluado esta
herramienta de anotación de entidades en el corpus de noticias CoNLL 2002. OpenCalais
obtiene valores de precisión aceptables en las principales clases (persona, lugares y
organización). Sin embargo, en comparación con los prototipos de investigación en
castellano puede mejorar la cobertura y el tratamiento de la ambigüedad.

Texto completo:

PDF