METHOD SYSTEM AND COMPUTER PROGRAM TO SPEAKER DIARISATION USING SPEECH ACTIVITY DETECTION BASED ON SPEARKER EMBEDDING
화자 임베딩 기반 음성 활동 검출을 이용한 화자 분할 방법, 시스템, 및 컴퓨터 프로그램이 개시된다. 화자 분할 방법은, 주어진 음성 파일에 대해 음성 프레임 별로 화자 임베딩을 추출하는 단계; 및 상기 화자 임베딩에 기초하여 음성 활동 영역(speech activity region)인 음성 구간을 검출하는 단계를 포함한다. To provide a speaker dialization method, a system, and a computer program using voice activity detection based on spe...
Saved in:
Main Authors | , , , , |
---|---|
Format | Patent |
Language | English Korean |
Published |
08.06.2022
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | 화자 임베딩 기반 음성 활동 검출을 이용한 화자 분할 방법, 시스템, 및 컴퓨터 프로그램이 개시된다. 화자 분할 방법은, 주어진 음성 파일에 대해 음성 프레임 별로 화자 임베딩을 추출하는 단계; 및 상기 화자 임베딩에 기초하여 음성 활동 영역(speech activity region)인 음성 구간을 검출하는 단계를 포함한다.
To provide a speaker dialization method, a system, and a computer program using voice activity detection based on speaker embedding.SOLUTION: A speaker dialization method includes stages of: extracting speaker embedding for each voice frame for a given voice file; and detecting voice segments that are speech activity regions based on the speaker embedding.SELECTED DRAWING: Figure 4 |
---|---|
Bibliography: | Application Number: KR20200163743 |