A machine learning method for identifying impersonal constructions and zero pronouns in Spanish

Luz Rello , Pablo Suárez , Ruslan Mitkov

Resumen


En este trabajo se presenta un método basado en aprendizaje automático para la clasificación de la elipsis del sujeto como referencial o no referencial
en español. Se trata, tal como se desprende de la revisión bibliográfica realizada, del primer intento de identificar construcciones impersonales no referenciales en esta lengua. Una evaluación del sistema con un corpus de entrenamiento formado por 6.827 verbos anotados ha mostrado que alcanza una exactitud del 87%.

Texto completo:

PDF