DiSeg: Un segmentador discursivo automático para el español

Iria da Cunha , Eric SanJuan , Juan-Manuel Torres-Moreno , Marina Lloberas , Irene Castellón

Resumen


Hoy en día el análisis discursivo automático es un tema de investigación relevante. Sin embargo, no existen analizadores del discurso para textos en español. El primer paso para desarrollar esta herramienta es la segmentación discursiva. En este artículo presentamos DiSeg, el primer segmentador discursivo para el español, que utiliza el marco de la Rhetorical Structure Theory (Mann y Thompson, 1988) y se basa en reglas léxicas y sintácticas. Describimos el sistema y evaluamos sus resultados con un corpus gold standard, obteniendo resultados prometedores.

Texto completo:

PDF