APPARATUS AND METHOD FOR EXTRACTING INDEX
The present invention relates to an apparatus and a method for extracting a subject word, and more specifically, to an apparatus and a method for extracting a subject word from a book or an electronic book of which includes literary and non-literary genres. To this end, according to the present inve...
Saved in:
Main Authors | , , , , , |
---|---|
Format | Patent |
Language | English Korean |
Published |
13.09.2016
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | The present invention relates to an apparatus and a method for extracting a subject word, and more specifically, to an apparatus and a method for extracting a subject word from a book or an electronic book of which includes literary and non-literary genres. To this end, according to the present invention, the method for extracting the subject word from the book or the electronic book includes the steps of: dividing body content included in the book or the electronic book into a plurality of divided sections; extracting words included in each of the divided sections and frequency of the words, by performing morpheme analysis the divided sections, respectively; separating a general sentence from an important sentence in the divided sections; calculating an important sentence weighted value with respect to each of important words, based on the important words included in the important sentence, and frequency of the important words; and deriving the subject word of the book or the electronic book, based on the frequency of the words, and the important sentence weighted value with respect to the important sentence.
본 발명은 주제어 추출 장치 및 방법에 관한 것이고, 보다 상세하게 문학 장르와 비문학 장르를 포함하는 책 또는 전자 책의 주제어를 추출하는 장치 및 방법에 관한 것이다. 이를 위한 본 발명의 책 또는 전자 책의 주제어를 추출하는 방법은 책 또는 전자 책에 포함된 본문 내용을 복수의 분리 영역들로 분리하는 단계; 분리 영역들 각각에 대해 형태소 분석을 수행함으로써 각 분리 영역에 포함된 단어들과 단어들의 빈도수를 추출하는 단계; 복수의 분리 영역들에서 중요 문장과 일반 문장을 분리하는 단계; 중요 문장에 포함된 중요 단어들과, 중요 단어들에 대한 빈도수를 근거로, 각 중요 단어에 대한 중요 문장 가중치를 계산하는 단계; 및 단어들의 빈도수와 중요 문장에 대한 중요 문장 가중치를 근거로, 책 또는 전자 책에 대한 주제어를 도출하는 단계를 포함하는 것을 특징으로 한다. |
---|---|
Bibliography: | Application Number: KR20150029807 |