METHOD COMPUTER DEVICE AND COMPUTER PROGRAM FOR SPEAKER DIARIZATION USING MULTI-MODAL INFORMATION

멀티모달 정보를 사용하는 화자 분할 방법, 컴퓨터 장치, 및 컴퓨터 프로그램이 개시된다. 화자 분할 방법은, 클라이언트로부터 화자 분할 대상 음성으로 수신된 음성 파일에서 텍스트 정보를 추출하는 단계; 상기 음성 파일과 상기 텍스트 정보를 이용하여 화자 변경(speaker change)을 검출하는 단계; 및 상기 화자 변경 검출 결과를 기초로 상기 음성 파일에 대한 화자 분할을 수행하는 단계를 포함할 수 있다....

Full description

Saved in:
Bibliographic Details
Main Authors JUNG JEE WEON, GEONMIN KIM, HEO HEE SOO, KANG HAN YONG, KIM YOU JIN, KWON YOUNGKI, LEE BONG JIN, LEE CHAN KYU
Format Patent
LanguageEnglish
Korean
Published 04.09.2024
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:멀티모달 정보를 사용하는 화자 분할 방법, 컴퓨터 장치, 및 컴퓨터 프로그램이 개시된다. 화자 분할 방법은, 클라이언트로부터 화자 분할 대상 음성으로 수신된 음성 파일에서 텍스트 정보를 추출하는 단계; 상기 음성 파일과 상기 텍스트 정보를 이용하여 화자 변경(speaker change)을 검출하는 단계; 및 상기 화자 변경 검출 결과를 기초로 상기 음성 파일에 대한 화자 분할을 수행하는 단계를 포함할 수 있다.
Bibliography:Application Number: KR20230026979