위키백과 템플릿 네트워크를 이용한 COVID-19 범유행 정보 수집
COVID-19 범유행으로 인한 사회적 피해를 줄이기 위해 정확한 정보의 접근은 필수적이다. 위키백과는 접근성이 높은 인터넷 백과사전으로, 사용자들이 직접 편집을 할 수 있어 COVID-19와 같이 현재 진행 중인 사건에 대한 정보가 빠르게 갱신된다. 그러나 기존의 위키백과 정보 검색 방법으로는 문서 간의 관계를 포함한 정보를 수집하기 어려운 한계가 있다. 위키백과의 템플릿 형식은 높은 연관성을 가지는 문서에 선별적으로 적용되는 링크로 정보의 구조를 잘 반영한다. 이 연구에서는 템플릿을 활용하여 10개 언어 위키백과 내 COVID-...
Saved in:
Published in | Chŏngbo Kwahakhoe nonmunji pp. 347 - 353 |
---|---|
Main Authors | , , , , , , , , |
Format | Journal Article |
Language | Korean |
Published |
한국정보과학회
01.05.2022
|
Subjects | |
Online Access | Get full text |
ISSN | 2383-630X 2383-6296 |
DOI | 10.5626/JOK.2022.49.5.347 |
Cover
Summary: | COVID-19 범유행으로 인한 사회적 피해를 줄이기 위해 정확한 정보의 접근은 필수적이다. 위키백과는 접근성이 높은 인터넷 백과사전으로, 사용자들이 직접 편집을 할 수 있어 COVID-19와 같이 현재 진행 중인 사건에 대한 정보가 빠르게 갱신된다. 그러나 기존의 위키백과 정보 검색 방법으로는 문서 간의 관계를 포함한 정보를 수집하기 어려운 한계가 있다. 위키백과의 템플릿 형식은 높은 연관성을 가지는 문서에 선별적으로 적용되는 링크로 정보의 구조를 잘 반영한다. 이 연구에서는 템플릿을 활용하여 10개 언어 위키백과 내 COVID-19의 정보를 수집하고 네트워크 구조로 재구성하였다. 총 130,662개의 노드와 202,258개의 엣지로 구성된 10개의 네트워크 중 사용자 수가 많은 언어가 크기와 깊이가 큰 템플릿 네트워크를 가졌으며, 3홉 이내의 연결 구조 내에 COVID-19와 연관성이 높은 문서가 존재함을 확인할 수 있었다. 이 연구는 여러 언어에 적용 가능한 새로운 정보 검색 방법을 제안함으로써 특정 주제에 대한 문서의 구축에 기여한다. Access to accurate information is essential to reduce the social damage caused by the Coronavirus Disease 2019 (COVID-19) pandemic. Information about ongoing events, such as COVID-19, is quickly updated on Wikipedia, an accessible internet encyclopedia that allows users to edit it themselves. However, the existing Wikipedia information retrieval method has a limitation in collecting information, including relationships between documents. The template format of Wikipedia reflects the structure of information as a link that is selectively applied to documents with high relevance. This study collected information on COVID-19 in 10 languages on Wikipedia using a template and reorganized it into networks. Among the 10 networks with 130,662 nodes and 202,258 edges, languages with a large number of active users had a template network with a large size and depth, and documents highly related to COVID-19 existed within a 3-hop connection structure. This research proposed a new information retrieval method applicable to multiple languages and contributes to the construction of document lists related to specific topics. KCI Citation Count: 0 |
---|---|
ISSN: | 2383-630X 2383-6296 |
DOI: | 10.5626/JOK.2022.49.5.347 |