Extracción crosslingüe de documentos usando mapas semánticos no-lineales

Rafael E. Branchs, Marta R. Costa-jussà

Resumen


Se propone un procedimiento no-lineal de mapeado semántico para extraer información multilingüe. El método consiste en utilizar una técnica de reducción de espacio no lineal para agrupar colecciones de documentos multilingües. En el método propuesto, se construyen para cada lengua agrupaciones independientes de la colección multilingüe y se usan las similitudes de las expresiones semánticas para extraer documentos multilingües. Se implementan dos variantes del método y se comparan con técnicas de extracción de información multilingüe. El método propuesto, para unas tareas específicas, mejora el convencional.

Texto completo:

PDF PDF (English)