SYSTEM FOR GENERATING QUESTION-ANSWER DATA FOR MACHING LEARNING BASED ON MACHING READING COMPREHENSION

The present disclosure relates to a system and method for generating a data set for learning of a question and answer system based on machine learning. The method for generating learning data may comprise the steps of: performing language processing for text to be learned; receiving a set of a quest...

Full description

Saved in:
Bibliographic Details
Main Authors OH, YEON TAEK, HONG, YUN KI, HWANG, YI GYU, YOO, TAE JOON, MIN, KYUNG KOO, JANG, JAE YONG, HONG, SU LYN, KO SEOK TAE
Format Patent
LanguageEnglish
Korean
Published 24.05.2019
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present disclosure relates to a system and method for generating a data set for learning of a question and answer system based on machine learning. The method for generating learning data may comprise the steps of: performing language processing for text to be learned; receiving a set of a questions and answer related to the text; specifying a position of a sentence related to the question in the text and a position of a sentence related to the answer; and verifying the validity of the set of the question and answer based on whether the difference between the position of the sentence related to the question and the sentence related to the answer is greater than a predetermined value. 본 개시는 기계 독해 기반 질의 응답 시스템의 학습을 위한 데이터 셋을 생성하는 시스템 및 방법에 관한 것이다. 이를 위한, 학습 데이터 생성 방법은, 학습하고자 하는 본문에 대한 언어 처리를 수행하는 단계; 상기 본문과 관련된 질문 및 정답 세트를 수신하는 단계; 상기 본문 내 상기 질문과 관련된 문장의 위치 및 상기 정답과 관련된 문장의 위치를 특정하는 단계; 및 상기 질문과 관련된 문장의 위치 및 상기 정답과 관련된 문장의 위치 차이가 기 설정된 값 이상인지 여부를 기초로, 상기 질문 및 정답 세트의 유효성을 검증하는 단계를 포함할 수 있다.
Bibliography:Application Number: KR20170153356