METHOD COMPUTER DEVICE AND COMPUTER PROGRAM FOR SPEAKER DIARIZATION USING MULTI-MODAL INFORMATION
멀티모달 정보를 사용하는 화자 분할 방법, 컴퓨터 장치, 및 컴퓨터 프로그램이 개시된다. 화자 분할 방법은, 클라이언트로부터 화자 분할 대상 음성으로 수신된 음성 파일에서 텍스트 정보를 추출하는 단계; 상기 음성 파일과 상기 텍스트 정보를 이용하여 화자 변경(speaker change)을 검출하는 단계; 및 상기 화자 변경 검출 결과를 기초로 상기 음성 파일에 대한 화자 분할을 수행하는 단계를 포함할 수 있다....
Saved in:
Main Authors | , , , , , , , |
---|---|
Format | Patent |
Language | English Korean |
Published |
04.09.2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | 멀티모달 정보를 사용하는 화자 분할 방법, 컴퓨터 장치, 및 컴퓨터 프로그램이 개시된다. 화자 분할 방법은, 클라이언트로부터 화자 분할 대상 음성으로 수신된 음성 파일에서 텍스트 정보를 추출하는 단계; 상기 음성 파일과 상기 텍스트 정보를 이용하여 화자 변경(speaker change)을 검출하는 단계; 및 상기 화자 변경 검출 결과를 기초로 상기 음성 파일에 대한 화자 분할을 수행하는 단계를 포함할 수 있다. |
---|---|
Bibliography: | Application Number: KR20230026979 |