Del discurso a la acción: Clasificación de actos de habla en textos legislativos

Doaa Samy

Resumen


Los actos de habla son unidades básicas de la comunicación lingüística que permiten realizar acciones a través del lenguaje. En el texto legislativo, los diferentes tipos de actos de habla cobran especial relevancia a nivel pragmático porque detrás del lenguaje, existe una intención (acto ilocutivo) que va más allá de las palabras para organizar y cambiar la realidad en una sociedad. La teoría lingüística propone diferentes tipos de actos de habla. Este trabajo tiene como objetivo clasificar automáticamente tres tipos por su relevancia en el texto legislativo: 1) Los actos asertivos que describen hechos y realidades; 2) los actos directivos que definen las normas o regulan las relaciones y las competencias de la materia en cuestión; y 3) los actos compromisorios que reconocen los derechos y se comprometen a velar por estos derechos. Para la clasificación, se ha anotado un conjunto de 1325 enunciados divididos en subconjuntos de entrenamiento, validación (80%-20%) y un conjunto de prueba (250 enunciados). Se han entrenado y se han evaluado varios clasificadores automáticos multi-etiqueta y multiclase basándose en tres tipos de modelos: modelos clásicos de aprendizaje automático, modelos fundacionales del lenguaje (LLMs) de tipo “encoder” y un modelo fundacional generativo de tipo “decoder” mediante instrucciones prompting de 5 niveles (GPT 3.5). Los clasificadores basados en modelos “encoder” (BERT y RoBERTaLex) han obtenido los mejores resultados. BERT ha alcanzado un f1-macro de 0,85 y un f1- micro de 0,87. RoBERTaLex ha obtenido 0,86 en f1-macro y f1-micro.

Texto completo:

PDF