VOICE PROCESSING METHOD AND DEVICE ELECTRONIC EQUIPMENT AND STORAGE MEDIUM
The present invention relates to a voice processing method, a device, an electronic device, and a storage medium, and relates to the field of artificial intelligence technology, such as voice technology and deep learning. The method comprises the steps of: acquiring an original voice; extracting a s...
Saved in:
Main Authors | , , , , , |
---|---|
Format | Patent |
Language | English Korean |
Published |
19.09.2022
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | The present invention relates to a voice processing method, a device, an electronic device, and a storage medium, and relates to the field of artificial intelligence technology, such as voice technology and deep learning. The method comprises the steps of: acquiring an original voice; extracting a spectrogram from the original speech; obtaining a voice synthesis model comprising a first generation sub-model and a second generation sub-model; generating a harmonic structure of the spectrogram by processing the spectrogram by calling a first generation sub-model; and generating a target voice by calling a second generating sub-model and processing the harmonic structure and the spectrogram. As a result, the method provides relatively good synthesized sound quality, a high degree of tone reduction, stable pronunciation, and a small amount of computation.
본 발명은 음성 처리 방법, 장치, 전자 기기 및 저장 매체를 제공하는 바, 음성 기술 및 딥 러닝 등 인공지능 기술 분야에 관한 것이고, 구체적인 구현 수단은, 원초 음성을 획득하는 단계; 상기 원초 음성에서 스펙트로그램을 추출하는 단계; 음성 합성 모델은 제1 생성 서브 모델 및 제2 생성 서브 모델을 포함하는 음성 합성 모델을 획득하는 단계; 제1 생성 서브 모델을 호출하여 스펙트로그램을 처리하여, 스펙트로그램의 고조파 구조를 생성하는 단계; 및 제2 생성 서브 모델을 호출하여 고조파 구조 및 스펙트로그램을 처리하여, 타겟 음성을 생성하는 단계; 를 포함한다. 이로하여, 당해 방법은 합성 음질이 비교적 좋고, 음색 환원도가 높고, 발음이 안정적이며 계산량이 적은 특정을 구비한다. |
---|---|
Bibliography: | Application Number: KR20220109743 |