ELECTRONIC DEVICE FOR UPDATING A TARGET SPEAKER USING A VOICE SIGNAL IN AN AUDIO SIGNAL AND TARGET SPEAKER UPDATING METHOD THEREOF

전자 장치가 개시된다. 본 전자 장치는 음성 입력 수신부, 오디오 신호로부터 사용자의 음성 신호를 획득하기 위한 인공 지능 모델 및 복수의 사용자의 특징 정보가 저장된 메모리 및 오디오 신호가 음성 입력 수신부를 통해 수신되면, 복수의 사용자 중 타겟 화자로 설정된 제1 사용자의 특징 정보 및 수신된 오디오 신호를 인공 지능 모델에 입력하여 제1 오디오 신호를 획득하고, 제1 오디오 신호에 기초한 음성 인식이 실패한 경우, 수신된 오디오 신호에서 제1 오디오 신호를 제외한 제2 오디오 신호의 특징 정보 및 복수의 사용자 중 제1 사...

Full description

Saved in:
Bibliographic Details
Main Authors JUNG YOUNG MOON, HAN CHANG WOO, HWANG JUNG WOOK, YOO JONG UK, ROH JAE YOUNG, LEE DO KYUN
Format Patent
LanguageEnglish
Korean
Published 12.03.2024
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:전자 장치가 개시된다. 본 전자 장치는 음성 입력 수신부, 오디오 신호로부터 사용자의 음성 신호를 획득하기 위한 인공 지능 모델 및 복수의 사용자의 특징 정보가 저장된 메모리 및 오디오 신호가 음성 입력 수신부를 통해 수신되면, 복수의 사용자 중 타겟 화자로 설정된 제1 사용자의 특징 정보 및 수신된 오디오 신호를 인공 지능 모델에 입력하여 제1 오디오 신호를 획득하고, 제1 오디오 신호에 기초한 음성 인식이 실패한 경우, 수신된 오디오 신호에서 제1 오디오 신호를 제외한 제2 오디오 신호의 특징 정보 및 복수의 사용자 중 제1 사용자를 제외한 나머지 사용자의 특징 정보에 기초하여 유사도를 식별하고, 식별된 유사도를 이용하여 타겟 화자를 복수의 사용자 중 제2 사용자로 변경하는 프로세서를 포함한다. An electronic device is disclosed. The electronic device comprises: a voice input reception unit; a memory for storing an artificial intelligence model for acquiring a voice signal of a user from an audio signal, and information on characteristics of multiple users; and a processor for: acquiring, if the audio signal is received through the voice input reception unit, a first audio signal by inputting, to the artificial intelligence model, the received audio signal and information on a characteristic of a first user configured as a target speaker among the multiple users; if voice recognition based on the first audio signal fails, identifying the similarity on the basis of characteristic information of a second audio signal remaining after excluding the first audio signal from the received audio signal and information on a characteristic of a user remaining after excluding the first user among the multiple users; and changing the target speaker to a second user among the multiple users by using the identified similarity.
Bibliography:Application Number: KR20220112269