METHOD SYSTEM AND COMPUTER PROGRAM TO SPEAKER DIARISATION USING SPEECH ACTIVITY DETECTION BASED ON SPEARKER EMBEDDING

화자 임베딩 기반 음성 활동 검출을 이용한 화자 분할 방법, 시스템, 및 컴퓨터 프로그램이 개시된다. 화자 분할 방법은, 주어진 음성 파일에 대해 음성 프레임 별로 화자 임베딩을 추출하는 단계; 및 상기 화자 임베딩에 기초하여 음성 활동 영역(speech activity region)인 음성 구간을 검출하는 단계를 포함한다. To provide a speaker dialization method, a system, and a computer program using voice activity detection based on spe...

Full description

Saved in:
Bibliographic Details
Main Authors HAN ICKSANG, HEO HEE SOO, KWON YOUNGKI, LEE BONG JIN, CHUNG JOON SON
Format Patent
LanguageEnglish
Korean
Published 08.06.2022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:화자 임베딩 기반 음성 활동 검출을 이용한 화자 분할 방법, 시스템, 및 컴퓨터 프로그램이 개시된다. 화자 분할 방법은, 주어진 음성 파일에 대해 음성 프레임 별로 화자 임베딩을 추출하는 단계; 및 상기 화자 임베딩에 기초하여 음성 활동 영역(speech activity region)인 음성 구간을 검출하는 단계를 포함한다. To provide a speaker dialization method, a system, and a computer program using voice activity detection based on speaker embedding.SOLUTION: A speaker dialization method includes stages of: extracting speaker embedding for each voice frame for a given voice file; and detecting voice segments that are speech activity regions based on the speaker embedding.SELECTED DRAWING: Figure 4
Bibliography:Application Number: KR20200163743