Un Análisis Comparativo de Estrategias para la Categorización Semántica de Textos Cortos

María V. Rosas , Marcelo L. Errecalde , Paolo Rosso

Resumen


La categorización de textos cortos es, hoy en día, un área importante de investigación debido a que gran parte de la información que recibimos y con la cual trabajamos habitualmente tiene esta característica (e-mails, mensajes de texto, resúmenes de noticias, entre otros). Distintos trabajos han reportado resultados interesantes en la categorización de textos incorporando información semántica a la representación de los documentos. Sin embargo, estos trabajos no se han concentrado en general en las particularidades que presentan los textos cortos. Por otra parte, los métodos de desambiguación más difundidos (basados en corpus) no siempre son adecuados en los dominios que se intentan abordar. En estos casos, la desambiguación basada en conocimiento se convierte en una alternativa interesante a considerar. En este trabajo, estudiamos la efectividad de la categorización de textos cortos, cuando se utiliza información semántica obtenida con métodos basados en conocimiento. Los resultados obtenidos con este enfoque muestran mejoras interesantes que incentivan a continuar con esta línea de investigación.

Texto completo:

PDF