Detección automática de chilenismos verbales a partir de reglas morfosintácticas. Resultados preliminares

Walter Koza , Pedro Alfaro , Ricardo Martínez

Resumen


En el presente artículo, se describen las tareas realizadas para el desarrollo de un extractor automático de verbos diferenciales del español chileno mediante la aplicación de reglas de lenguaje natural. A partir de este objetivo, se procedió a la modelización de características léxicas, morfológicas y sintácticas de estas expresiones, la cual permitió la posterior implantación en máquina. En primer lugar, se clasificaron los chilenismos verbales en cuatro tipos, según su uso registrado en los diccionarios y su naturaleza sintáctica: puros, puros clíticos, de sentido y de sentido clíticos. En segundo lugar, se establecieron reglas sintácticas para el reconocimiento automático. En el trabajo computacional se utilizaron las herramientas Smorph y Módulo Post Smorph, que trabajan en bloque a base de reglas del lenguaje natural. Este método se probó en un corpus compuesto por 5.194 tweets, producidos por usuarios chilenos, logrando 85,54% de precisión, 96.16% de cobertura y 90,53% de medida f. Los resultados obtenidos permiten validar el método propuesto, aunque se detectaron algunas limitaciones y detecciones erróneas, lo que implicaría la especificación de algunas reglas y la creación de nuevas, tanto para la detección automática como para el filtrado de etiquetados erróneos.

Texto completo:

PDF