VOICE PROCESSING METHOD AND DEVICE ELECTRONIC EQUIPMENT AND STORAGE MEDIUM

The present invention relates to a voice processing method, a device, an electronic device, and a storage medium, and relates to the field of artificial intelligence technology, such as voice technology and deep learning. The method comprises the steps of: acquiring an original voice; extracting a s...

Full description

Saved in:
Bibliographic Details
Main Authors JIA LEI, WANG HAIFENG, HOU JIANKANG, NIE ZHIPENG, ZHANG LIQIANG, SUN TAO
Format Patent
LanguageEnglish
Korean
Published 19.09.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present invention relates to a voice processing method, a device, an electronic device, and a storage medium, and relates to the field of artificial intelligence technology, such as voice technology and deep learning. The method comprises the steps of: acquiring an original voice; extracting a spectrogram from the original speech; obtaining a voice synthesis model comprising a first generation sub-model and a second generation sub-model; generating a harmonic structure of the spectrogram by processing the spectrogram by calling a first generation sub-model; and generating a target voice by calling a second generating sub-model and processing the harmonic structure and the spectrogram. As a result, the method provides relatively good synthesized sound quality, a high degree of tone reduction, stable pronunciation, and a small amount of computation. 본 발명은 음성 처리 방법, 장치, 전자 기기 및 저장 매체를 제공하는 바, 음성 기술 및 딥 러닝 등 인공지능 기술 분야에 관한 것이고, 구체적인 구현 수단은, 원초 음성을 획득하는 단계; 상기 원초 음성에서 스펙트로그램을 추출하는 단계; 음성 합성 모델은 제1 생성 서브 모델 및 제2 생성 서브 모델을 포함하는 음성 합성 모델을 획득하는 단계; 제1 생성 서브 모델을 호출하여 스펙트로그램을 처리하여, 스펙트로그램의 고조파 구조를 생성하는 단계; 및 제2 생성 서브 모델을 호출하여 고조파 구조 및 스펙트로그램을 처리하여, 타겟 음성을 생성하는 단계; 를 포함한다. 이로하여, 당해 방법은 합성 음질이 비교적 좋고, 음색 환원도가 높고, 발음이 안정적이며 계산량이 적은 특정을 구비한다.
Bibliography:Application Number: KR20220109743