Detección de vocales mediante modelado o de clusters de fonemas

Iker Luengo

Resumen


La detección de regiones estables dentro de una señal de voz es necesaria en muchos sistemas de procesado del habla. Las vocales se corresponden precisamente con regiones de gran estabilidad, por lo que su detección automática puede ser muy conveniente. Este trabajo presenta un sistema de detección automática de vocales en la voz, mediante un identificador basado en modelos HMM de grupos fon´ticos. Estos grupos fonéticos, creados según la similitud acústica de los fonemas, son la clave para el correcto funcionamiento del sistema en diferentes idiomas. Aunque los modelos han sido entrenados para euskera, las pruebas realizadas sobre bases de datos en euskera y en alemán demuestran que el sistema permite detectar las vocales  y sus fronteras temporales con una precisión aceptable en ambos idiomas.

Texto completo:

PDF PDF (English)