Detección de plagio en documentos. Sistema externo monolingüe de altas prestaciones basado en n-gramas contextuales

Diego Antonio Rodríguez Torrejón , José Manuel Martín Ramos

Resumen


En este artículo se presenta una propuesta de sistema de detección de plagio externo monolingüe basada en una modificación del concepto de n-grama (n-grama contextual), un nuevo motor de búsqueda basado en dicho concepto, y una nueva estrategia de determinación del plagio y sus límites (monotonía referencial). Los resultados de evaluación obtenidos son comparables a los del primer clasificado en la PAN'09, aunque obtenidos con un muy inferior coste computacional (tiempo de ejecución entre 30 y 45 minutos en un PC portátil sin uso de programación concurrente), lo que lo convierte en una muy interesante alternativa a explotar.
Palabras clave: detección de plagio, n-grama, n-grama contextual, Monotonía Referencial, Recuperación de Información.

Texto completo:

PDF