Búsqueda de Respuestas multilingüe: ¿es buena idea buscar respuestas en otros idiomas distintos a los de la pregunta?

Miguel Angel García Cumbreras , Fernando Martínez Santiago , L. Alfonso Ureña López , José Manuel Perea Ortega

Resumen


Actualmente existen algunas iniciativas dentro de la tarea de Búsqueda de Respuestas orientadas al desarrollo de sistemas capacitados para encontrar respuestas sobre colecciones multilingües. Esto es, el usuario puede formular su consulta en diversos idiomas, y puede obtener la respuesta a partir de colecciones documentales escritas igualmente en diversos idiomas. Por un lado, para una pregunta dada, buscar en más documentos conlleva más documentos relevantes y por lo tanto mayor probabilidad de encontrar una respuesta satisfactoria. Por otro lado, la multilingualidad requiere necesariamente de un proceso de traducción automática, bien de la consulta, bien de los pasajes relevantes o bien de ambos, con la consiguiente introducción de ruido ¿Hasta qué punto ese ruido distorsiona los resultados? ¿Aportan todas las colecciones monolingües al rendimiento global del sistema multilingüe o por el contrario depende de cómo de bien representado esté ese idioma dentro del sistema multilingüe? En este trabajo hemos encontrado que un sistema de búsquedas de respuestas multilingüe puede superar a uno monolingüe, y que la aportación de cada idioma es desigual, pero en todos los casos es significativa.

Texto completo:

PDF