Sintetizador de fala tendo base de dados de elemento acústico

SINTETIZADOR DE FALA TENDO BASE DE DADOS DE ELEMENTO ACúSTICO Um método de síntese de fala emprega uma base de dados de elemento acústico que é estabelecida a partir de seq³ências fonéticas ocorridas em um intervalo de um sinal de fala. ao estabelecer a base de dados, trajetórias são determinadas (2...

Full description

Saved in:
Bibliographic Details
Main Authors JOSEPH PHILIP OLIVE, MICHAEL ABRAHAM TANENBLATT, BERND MOEBIUS, JAN PIETER VAN SANTEN
Format Patent
LanguagePortuguese
Published 23.05.2000
Edition7
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:SINTETIZADOR DE FALA TENDO BASE DE DADOS DE ELEMENTO ACúSTICO Um método de síntese de fala emprega uma base de dados de elemento acústico que é estabelecida a partir de seq³ências fonéticas ocorridas em um intervalo de um sinal de fala. ao estabelecer a base de dados, trajetórias são determinadas (220) para cada uma das seq³ências fonéticas contendo um segmento fonético que corresponde a um fonema particular (210). Uma região de tolerância é então identificada baseada em uma concentração de trajetórias que correspondem às seq³ências de fonemas diferentes (230). Os elementos acústicos para a base de dados (260) são formados por porções das seq³ências fonéticas ao identificar pontos de corte (250) nas seq³ências fonéticas que correspondem aos pontos de tempo ao longo das trajetórias respectivas próximas à região de tolerância (240). Desta maneira, é possível concatenar os elementos acústicos tendo um fonema de junção comum, de modo que descontinuidades perceptíveis nos fonemas de junção sejam minimizadas. Métodos computacionalmente simples e rápidos para determinar a região de tolerância são também expostos. A speech synthesis method employs an acoustic element database that is established from phonetic sequences occurring in an interval of a speech signal. In establishing the database, trajectories are determined for each of the phonetic sequences containing a phonetic segment that corresponds to a particular phoneme. A tolerance region is then identified based on a concentration of trajectories that correspond to different phoneme sequences. The acoustic elements for the database are formed from portions of the phonetic sequences by identifying cut points in the phonetic sequences which correspond to time points along the respective trajectories proximate the tolerance region. In this manner, it is possible to concatenate the acoustic elements having a common junction phonemes such that perceptible discontinuities at the junction phonemes are minimized. Computationally simple and fast methods for determining the tolerance region are also disclosed.
Bibliography:Application Number: BR19969612624