Tarántula -> araña -> animal: asignación de hiperónimos de segundo nivel basada en métodos de similitud distribucional

Rogelio Nazar, Javier Obreque, Irene Renau

Resumen


La asignación automática de hiperónimos sigue presentando problemas para el procesamiento del lenguaje natural. En particular, los sustantivos polisémicos se vinculan a distintos hiperónimos y por ello pueden causar problemas estructurales en una taxonomía léxica. Por ejemplo, el sustantivo tarántula puede ser registrado como hipónimo de araña y, como este es un sustantivo polisémico (puede denotar a un ser vivo o a un tipo de lámpara), es necesario determinar cuál es el hiperónimo siguiente en la cadena: animal o artefacto. En el presente artículo exploramos métodos para resolver este problema utilizando el cálculo de la similitud entre sustantivos utilizando como variable predictora los verbos con los que coocurren. Los mejores resultados (84% de acierto) se obtienen con un método simple que solo mide coocurrencia, sin tener en cuenta información sintáctica.

Texto completo:

PDF