Unidad discursiva y relaciones retóricas: un estudio acerca de las unidades de discurso en el etiquetado de un corpus en euskera

Mikel Iruskieta , Arantza Diaz de Ilarraza , Mikel Lersundi

Resumen


Resumen: En este artículo se describe el estudio realizado sobre las características del etiquetado de la estructura de discurso, según la Teoría de la Estructura Retórica, en los niveles inter-oracional e intra-oracional. El corpus etiquetado está compuesto por textos médicos escritos en euskera y extraídos de la Gaceta Médica de Bilbao. En este trabajo analizaremos las dificultades encontradas en el proceso de identificación de las unidades de discurso y en el establecimiento de relaciones en cada nivel basándonos en la observación de los acuerdos y desacuerdos identificados en los textos anotados por dos anotadores. Comprobamos que la segmentación en unidades de discurso es más compleja a nivel intra-oracional mientras que la asignación de relaciones retóricas lo es a nivel inter-relacional. Asimismo, observamos que hay relaciones que aparecen más frecuentemente a nivel intra-oracional que a nivel inter-oracional. Este estudio será la base para poder llevar a cabo el proceso de anotación automática que queremos afrontar.

Texto completo:

PDF