Construcción del RomCro, un corpus paralelo multilingüe

Gorana Bikić-Carić, Bojana Mikelenić, Metka Bezlajo

Resumen


En este trabajo se presentan las fases de construcción de un corpus paralelo multilingüe de cinco lenguas romances y croata. El corpus contiene oraciones originales provenientes de textos literarios de los siglos XX y XXI, alineadas con sus traducciones al resto de los idiomas. El orden original de las oraciones ha sido cambiado. El corpus cuenta con 15,9 millones de palabras y está disponible en las plataformas Sketch Engine y ELRC.

Texto completo:

PDF