RE-SPEECH RECOGNITION WITH EXTERNAL DATA SOURCES

FIELD: data processing.SUBSTANCE: invention relates to means for producing transcription of a speech fragment. An initial version of the transcription of the speech fragment is obtained using an automated speech recognizer. Based on the language model not used by the automated speech recognizer when...

Full description

Saved in:
Bibliographic Details
Main Authors SCHALKWYK, Johan, STROHMAN, Trevor D, SKOBELTSYN, Gleb
Format Patent
LanguageEnglish
Russian
Published 21.05.2019
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:FIELD: data processing.SUBSTANCE: invention relates to means for producing transcription of a speech fragment. An initial version of the transcription of the speech fragment is obtained using an automated speech recognizer. Based on the language model not used by the automated speech recognizer when generating the original transcription, one or more terms which are phonetically similar to one or more terms which are already present in the original transcription version are identified. At the same time determination, whether phonetically terms are similar, provide definition of measure of similarity and comparison of measure with threshold, or determination, whether measure of similarity of measure of similarity relative to other pairs of terms exceeds. One or more additional transcription variants are generated based on the identified one or more terms. Transcription is selected from transcription variants.EFFECT: technical result consists in improvement of accuracy of transcription of speech fragment.20 cl, 3 dwg Изобретение относится к средствам для получения транскрипции речевого фрагмента. Технический результат заключается в повышении точности транскрипции речевого фрагмента. Получают первоначальный вариант транскрипции речевого фрагмента с использованием автоматизированного распознавателя речи. Идентифицируют, на основе языковой модели, которая не используется автоматизированным распознавателем речи при генерировании первоначального варианта транскрипции, один или более терминов, фонетически аналогичных одному или более терминам, которые уже присутствуют в первоначальном варианте транскрипции. При этом определение, аналогичны ли фонетически термины, предусматривают определение меры сходства и сравнение меры с порогом, или определение, превышает ли мера сходства меры сходства, относящиеся к другим парам терминов. Генерируют один или более дополнительных вариантов транскрипции на основе идентифицированных одного или более терминов. Выбирают транскрипцию из вариантов транскрипции. 3 н. и 17 з.п. ф-лы, 3 ил.
Bibliography:Application Number: RU20180117655