Application of Information Retrieval Techniques to Document Filtered Set Generation for External Plagiarism Detection

Daniel Micol , Oscar Ferrández , Rafael Muñoz

Resumen


En este artículo presentamos un método para la generación de conjuntos filtrados de documentos empleando técnicas de recuperación de información. Esto se presenta en el contexto de la detección de plagios externos, aunque las técnicas detalladas en este artículo son aplicables a cualquier tipo de documentos o consultas.
La producción de conjuntos filtrados, y por ende la limitación del espacio
de búsqueda del problema, puede resultar en una gran mejora de rendimiento y es utilizada hoy en día en gran cantidad de aplicaciones reales, como buscadores web.
Respecto a la detección de plagios en documentos, la base de datos de textos con
los que comparar el candidato sospechoso es potencialmente grande, y por lo tanto
es muy recomendable aplicar técnicas de generación de conjuntos filtrados.

Texto completo:

PDF