METHOD AND SYSTEM FOR DYNAMICALLY ADJUSTED TRAINING FOR SPEECH RECOGNITION

A method and system for dynamically selecting words for training a speech recognition system. The speech recognition system models each phoneme using a hidden Markov model and represents each word as a sequence of phonemes. The training system ranks each phoneme for each frame according to the proba...

Full description

Saved in:

Bibliographic Details
Main Authors	ROZAK, MICHAEL, J, HUANG, XUEDONG, D, JIANG, LI, MAHAJAN, MILIND, V, HON, HSIAO-WUEN, HWANG, MEI-YUH, JU, YUNNG
Format	Patent
Language	English French
Published	08.01.1998
Edition	6
Subjects	ACOUSTICS MUSICAL INSTRUMENTS PHYSICS SPEECH ANALYSIS OR SYNTHESIS SPEECH OR AUDIO CODING OR DECODING SPEECH OR VOICE PROCESSING SPEECH RECOGNITION
Online Access	Get full text

Cover

Loading…

More Information
Summary:	A method and system for dynamically selecting words for training a speech recognition system. The speech recognition system models each phoneme using a hidden Markov model and represents each word as a sequence of phonemes. The training system ranks each phoneme for each frame according to the probability that the corresponding codeword will be spoken as part of the phoneme. The training system collects spoken utterances for which the corresponding word is known. The training system then aligns the codewords of each utterance with the phoneme that it is recognized to be part of. The training system then calculates an average rank for each phoneme using the aligned codewords for the aligned frames. Finally, the training system selects words for training that contain phonemes with a low rank. La présente invention a pour objet un procédé et un système consistant à sélectionner des mots utilisés pour l'auto-apprentissage d'un système de reconnaissance de la parole. Ledit système de reconnaissance de la parole établit un modèle pour chaque phonème à l'aide d'un modèle de Markov caché et représente chaque mot sous forme de séquence de phonèmes. Le système d'auto-apprentissage classe chaque phonème de chaque trame en fonction de la probabilité que le mot de code correspondant soit prononcé dans le cadre du phonème. Il receuille les émissisons de parole verbale pour lesquelles le mot correspondant est connu. Ledit système cadre ensuite les mots de code de chacune des émissions de parole avec le phonème reconnu comme faisant partie de ceux-ci. Il calcule ensuite un rang moyen pour chaque phonème à l'aide des noms de code cadrés correspondant aux trames cadrées. Enfin, le système d'auto-apprentissage sélectionne les mots destinés à l'auto-apprentissage et contenant des phonèmes de faible rang.
Bibliography:	Application Number: WO1997US11683