Violencia Identificada en el Lenguaje (VIL). Creación de recurso para mensajes violentos

Beatriz Botella, Robiert Sepúlveda-Torres, Patricio Martínez Barco, Estela Saquete

Resumen


La sociedad avanza cargada de conocimientos nuevos y muy accesibles, que se publican en el mundo virtual. Es una realidad que las Tecnologías de la Información y la Comunicación (TIC) han traído muchos beneficios a nuestras vidas pero también vemos como año tras año aumenta el uso de violencia en plataformas digitales. Nuestro trabajo se enfoca en la creación de recursos que permitan la detección de mensajes violentos en la red social Twitter. Se parte de la creación de una guía de anotación de grano fino para anotar un corpus de mensajes violentos (VIL) con el fin de utilizar herramientas de aprendizaje automático que nos ayuden a detectar automáticamente el problema. Con este corpus se entrenan dos modelos de lenguaje (BETO y RoBERTa base) con los que se alcanza un valor en la métrica F1m de 97.03 % y 96.51 % clasificando si un tuit es o no violento.

Texto completo:

PDF