Técnicas de post-procesado de resultados en un sistema de diarización de locutores

David Tavarez , Eva Navas , Daniel Erro , Ibon Saratxaga , Inma Hernaez

Resumen


Este artículo presenta las técnicas de postprocesado diseñadas para mejorar los resultados de un sistema de diarización de locutores. Se han propuesto tres técnicas de mejora: el refinado de la segmentación voz/no voz, la asimilación de los segmentos cortos y la fusión de los clusters del mismo locutor. Las técnicas se han implementado en un módulo que se aplica como etapa de postprocesado y que ha mejorado un 22.3 \% el resultado del sistema base. El módulo se ha aplicado sin realizar ningún ajuste sobre otro sistema de diarización de arquitectura similar al sistema base con una mejora del 21 \% y sobre uno con arquitectura muy diferente sin conseguirse mejoras. Asimismo se ha utilizado con otra base de datos y se ha conseguido mejorar el DER un 17\%. Esto demuestra la validez de las t\'ecnicas desarrolladas para la mejora de los resultados de la diarización.

Texto completo:

PDF