NoNiRes: Corpus del catalán anotado con negación

Laura Tañá Velasco, Montserrat Nofre Maiz, Blanca Calvo Figueras, Carme Armentano-Oller

Resumen


En este artículo se presentan los criterios aplicados para la anotación de la negación y del foco de la negación del corpus NoNiRes del catalán. El corpus está constituido por 20.600 oraciones procedentes de datasets ya existentes (5.000 oraciones), un foro de Internet (10.000 oraciones) y un periódico digital (5.600 oraciones). Se han tratado aspectos complejos como son el foco y la gradación de la negación. Se ofrecen datos estadísticos exhaustivos sobre las estructuras anotadas.

Texto completo:

PDF