Un método de aprendizaje semi-supervisado para la modelización semántica en comprensión del habla

L. Ortega , I. Galiano , L.F. Hurtado , E. Sanchis , E. Segarra

Resumen


En este artículo presentamos un algoritmo para el aprendizaje estadístico de modelos semánticos, a partir de un corpus de pares de sentencias y su representación semántica en términos de frames. El objetivo final es poder es asociar automáticamente segmentos de longitud variable con sus correspondientes etiquetas semánticas para ser usados en tareas de comprensión de habla. Una de las ventajas de esta aproximación consiste en evitar el costoso trabajo de segmentar y etiquetar todo el corpus de aprendizaje, además de su capacidad de aprendizaje discriminativo. Hemos aplicado este algoritmo al desarrollo del módulo de comprensión de un sistema de diálogo hablado, cuya tarea es el acceso a información sobre trenes. Se presentan experimentos que confirman lo adecuado de la metodología, dado el ahorro de esfuerzo en la preparación del corpus

Texto completo:

PDF