TRAINING APPARATUS AND METHOD OF MACHINE LEARNING MODEL AND APPARATUS AND METHOD FOR DOCUMENT SUMMARY USING THE SAME

Disclosed are an apparatus and a method for training a machine learning model, and an apparatus and a method for summarizing a document using the same. The apparatus for training a machine learning model according to one embodiment of the present invention comprises: a pre-processing module segmenti...

Full description

Saved in:
Bibliographic Details
Main Authors CHOI HYUN JIN, HWANG BONG KYU, LEE HYUN JAE, KIM JU DONG, YUN JAE WOONG
Format Patent
LanguageEnglish
Korean
Published 28.04.2023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:Disclosed are an apparatus and a method for training a machine learning model, and an apparatus and a method for summarizing a document using the same. The apparatus for training a machine learning model according to one embodiment of the present invention comprises: a pre-processing module segmenting a document into individual sentences and performing tokenization to create a sequence of tokens for the document, wherein a document representative token representing the document and a sentence representative token representing each sentence are included in the sequence of tokens for the document; a first training module training the machine learning model to predict the sequence of sentences in the document, based on the sequence of tokens for the document; and a second training module training the machine learning model to perform the maximization of document similarity based on the sequence of tokens for the document. Accordingly, when documents are summarized, subjective elements of a specific person can be excluded. 머신 러닝 모델의 학습 장치와 방법 및 이를 이용한 문서 요약 장치와 방법이 개시된다. 개시되는 일 실시예에 따른 머신 러닝 모델의 학습 장치는, 문서를 각 문장으로 분할하고, 토큰화를 수행하여 문서에 대한 토큰 시퀀스를 생성하되, 문서에 대한 토큰 시퀀스에 문서를 대표하는 문서 대표 토큰 및 각 문장을 대표하는 문장 대표 토큰들을 포함시키는 전처리 모듈, 문서에 대한 토큰 시퀀스에 기반하여 문서 내 문장들의 순서를 예측하도록 머신 러닝 모델을 학습시키는 제1 학습 모듈, 및 문서에 대한 토큰 시퀀스에 기반하여 문서 유사도 최대화를 수행하도록 머신 러닝 모델을 학습시키는 제2 학습 모듈을 포함한다.
Bibliography:Application Number: KR20210140881