Técnicas de Aprendizaje Artificial Aplicadas al Problema Inverso de la Síntesis Articulatoria de Voz por Computadora

(Resumen)

 

Esta investigación describe el problema inverso de la síntesis articulatoria y la aplicación de técnicas de aprendizaje artificial para su solución, específicamente, redes neuronales y algoritmos genéticos. La síntesis articulatoria recurre a tres modelos: el articulatorio, el acústico, y el de la fuente de excitación. El primero reúne a varios articuladores sobre el plano medial, logrando una reducción del espacio de búsqueda respecto a los modelos estrictamente basados en la función de área. Además, los cambios en la configuración medial se encuentran determinados por contracciones de un conjunto de músculos supraglotales agrupados en el vector articulatorio. Como en la actualidad no existen métricas precisas sobre los efectos e interconexiones de estos músculos, se apela a otra técnica de computación inteligente, el modelado con reglas difusas, para representar la actividad muscular asociada al desplazamiento de la masa lingual. Por su parte, el modelo acústico abarca la propagación de la onda en los tractos supraglotales. Concretamente, la inversión recupera los mejores vectores articulatorios para reproducir las características de frecuencia de un grupo de señales objeto, utilizando los tres modelos. En este sentido, aquí se desarrollan experimentos de inversión con las vocales y las consonantes /m/, /n/, /f/ y /s/, grabadas a locutores venezolanos. Con los fonemas sonoros, una Red con Estados de Eco modela la fuente de excitación. Las señales de entrenamiento de dicha red provienen de un modelo mecánico de dos masas del sistema glotal. Para las fricativas, la excitación es una fuente de turbulencia. Después, mediante un Algoritmo Genético Continuo, se evolucionan poblaciones de configuraciones articulatorias mediales para aproximar las características acústicas de las señales de voz objeto. Los valores de la función objeto, junto a las evaluaciones subjetivas desarrolladas, verifican positivamente la efectividad de las técnicas inteligentes.

Palabras Clave: Problema inverso del habla, síntesis articulatoria, modelo articulatorio medial, modelo acústico, aprendizaje artificial, redes con estados de eco, lógica difusa, algoritmos genéticos.

 

Autor: MSc. José Alejandro Brito Boadas.