A Multilingual Multi-domain Data-to-Text Natural Language Generation Approach

Cristina Barros, Elena Lloret

Resumen


La investigación en enfoques multidominio innovadores y flexibles puede ser un paso significativo en el área de Generación del Lenguaje Natural. En este sentido, el objetivo de este artículo es presentar un enfoque estadístico centrado en la fase de realización. Este enfoque permite la generación de oraciones que cumplan un propósito dado por una “característica semilla” de entrada, la cual se encargará de guiar el proceso de generación. Este enfoque ha sido probado en el ámbito de generar automáticamente oraciones que expresan opiniones para rese˜nas de películas y, además, el enfoque también ha sido probrado en el ámbito de generación del lenguaje para tecnologías de apoyo a problemas relacionados con el lenguaje. Dados los resultados obtenidos, este enfoque es capaz de generar oraciones para dos dominios diferentes con un rendimiento similar en dos idiomas diferentes, obteniendo buenos resultados y cumpliendo los requisitos especificados para cada dominio. Palabras clave: Generación de lenguaje natural, “característica semilla”, modelos de lenguaje factorizados, realización

Texto completo:

PDF


DOI: http://dx.doi.org/10.26342/2017-58-5411