SEARCH ENGINE SYSTEM AND METHOD BASED ON DISTRIBUTED DATA STORING APPARATUS SEARCH METHOD THEREOF

The present invention relates to a search engine system based on a distributed data storage device and a search method thereof. According to an embodiment of the present invention, a search engine system based on a distributed data storage device comprises: a user terminal which can be connected to...

Full description

Saved in:
Bibliographic Details
Main Authors YANG JAE SEOK, JANG JUNG HOON
Format Patent
LanguageEnglish
Korean
Published 16.03.2020
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present invention relates to a search engine system based on a distributed data storage device and a search method thereof. According to an embodiment of the present invention, a search engine system based on a distributed data storage device comprises: a user terminal which can be connected to a network and inputs a search request; a search engine server which includes an index module for generating index data including an inverted index file and an original document file with respect to a target document when the target document for index generation is collected; and a distributed storage device for receiving and storing the original document file generated by the index module, wherein when the search request is input from the user terminal, the search engine server parses and analyzes a search query corresponding to the search request, calculates a search result for the search request by using an inverted index file including words included in the search query, and returns the calculated search result. According to an embodiment of the present invention, all the search engine nodes share only the inverted index file among index result files including the inverted index file and the original document file, and the original document file is stored in the distributed data storage device, thereby reducing costs for transmitting unnecessary data, and improving the search speed by allowing search to be performed through only the inverted index file when a search query request is performed. 본 발명은 분산 데이터 저장 장치 기반 검색 엔진 시스템 및 검색 방법에 관한 것으로, 본 발명의 일 실시예에 따르는 분산 데이터 저장 장치 기반 검색 엔진 시스템은, 네트워크에 연결가능하고 검색 요청을 입력하는 유저 단말과, 색인 생성의 대상이 되는 대상 문서가 수집되면 상기 대상 문서에 대하여 역 색인 파일과 원문 파일을 포함하는 색인 데이터를 생성하는 색인 모듈을 포함하는 검색 엔진 서버와, 상기 색인 모듈에 의해 생성된 원문 파일을 전달받아 저장하는 분산 저장 장치를 포함한다. 여기서, 상기 검색 엔진 서버는 상기 유저 단말로부터 검색 요청이 입력되면, 상기 검색 요청에 상응하는 검색 질의문을 구문 분석한 후에 상기 검색 질의문에 포함된 단어를 포함하는 역 색인 파일을 이용하여 상기 검색 요청에 대한 검색 결과를 연산하고 이를 반환하는 것을 특징으로 한다. 본 발명의 일 실시예에 따르면, 역 색인 파일과 원문 파일을 포함한 색인 결과 파일 중에서 역 색인 파일만 모든 검색 엔진 노드가 공유하고, 원문 파일은 분산 데이터 저장 장치에 저장함으로써 불필요한 데이터를 전송하기 위한 비용을 줄이며, 검색 질의 요청 수행 시에 역 색인 파일만을 통해 검색이 이뤄지도록 함으로써 검색 속도를 향상시킬 수 있다.
Bibliography:Application Number: KR20190010514