Resolución de Correferencia de Nombres de Persona para Extracción de Información Biográfica

Marcos Garcia , Pablo Gamallo

Resumen


Los sistemas de extracción de información necesitan un procesamiento previo que
reconozca, entre otras cosas, elementos correferenciales tales como las variantes de nombres
propios. El presente artículo tiene dos objetivos: por un lado, describe los principales tipos
de correferencia de nombres de persona encontrados en textos enciclopédicos y periodísticos en castellano. Por otro lado, presenta un algoritmo que resuelve satisfactoriamente la mayor parte de los casos descritos. El sistema, que no necesita corpus de ntrenamiento, permite unificar las variantes de nombres de persona que aparecen en un texto, mejorando así tareas
como la extracción de información biográfica.

Texto completo:

PDF