한국어 소설에서 주요 인물명 인식 기법

The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that built beforehand. In English, names begin with upper cases and are used with some words. In this paper, we propose a recognition method for main...

Full description

Saved in:
Bibliographic Details
Published in한국정보전자통신기술학회 논문지 Vol. 9; no. 1; pp. 75 - 81
Main Authors 김서희(Seo-Hee Kim), 박태근(Tae-Keun Park), 김승훈(Seung-Hoon Kim)
Format Journal Article
LanguageKorean
Published 한국정보전자통신기술학회 2016
Subjects
Online AccessGet full text
ISSN2005-081X
2288-9302

Cover

Abstract The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that built beforehand. In English, names begin with upper cases and are used with some words. In this paper, we propose a recognition method for main characters name in Korean novels by using predicates, rules and weights. We first recognize candidates for the characters name by predicates and propose some rules to exclude candidates that cannot be characters. We assign importances for candidates, considering weights that given by the number of candidates appeared in a sentence. Finally, if the importance of the character is more than a threshold, we decide that the character is one of main characters. The results from the experiments for 300 novels show that an average accuracy is 85.97%. The main characters name may be used to grasp relationships among characters, character's action and tendency. 소설에서 주요 인물은 소설의 이야기를 전개하는 아주 중요한 역할을 담당하여 소설에서 없어서는 안 되는 중심인물을 의미한다. 기존의 인물명 인식 연구에서는 구축해놓은 인물명 사전을 통해 인물명을 인식하였고, 영어의 경우 대소문자 구별이 있으며 인물명과 함께 사용되는 단어를 활용하여 인물명을 인식하였다. 본 논문에서는 한국어 소설에서 용언, 규칙 및 가중치를 이용한 주요 인물명 인식 기법에 대해 제안한다. 먼저, 인물이 행할 수 있는 용언을 근거로 인물명 후보를 인식하고, 인식된 인물명 후보 중 인물명으로 사용될 수 없는 규칙에 해당되는 후보들을 제거한다. 문장에 나타나는 인물명 후보의 수에 따라 가중치를 부여하여 중요도를 계산하고, 중요도가 임계치 이상인 경우 주요 인물명으로 판단한다. 소설 300권을 대상으로 실험 결과 평균 85.97%의 정확도를 보였다. 인식된 주요 인물명은 향후 소설내 등장인물 간 연관관계를 파악하거나 등장인물의 행위, 성향 등을 파악하는데 활용될 수 있다.
AbstractList 소설에서 주요 인물은 소설의 이야기를 전개하는 아주 중요한 역할을 담당하여 소설에서 없어서는 안 되는 중심인물을 의미한다. 기존의 인물명 인식 연구에서는 구축해놓은 인물명 사전을 통해 인물명을 인식하였고, 영어의 경우 대소문자 구별이 있으며 인물명과 함께 사용되는 단어를 활용하여 인물명을 인식하였다. 본 논문에서는 한국어 소설에서 용언, 규칙 및 가중치를 이용한 주요 인물명 인식 기법에 대해 제안한다. 먼저, 인물이 행할 수 있는 용언을 근거로 인물명 후보를 인식하고, 인식된 인물명 후보 중 인물명으로 사용될 수 없는 규칙에 해당되는 후보들을 제거한다. 문장에 나타나는 인물명 후보의 수에 따라 가중치를 부여하여 중요도를 계산하고, 중요도가 임계치 이상인 경우 주요 인물명으로 판단한다. 소설 300권을 대상으로 실험 결과 평균 85.97%의 정확도를 보였다. 인식된 주요 인물명은 향후 소설 내 등장인물 간 연관관계를 파악하거나 등장인물의 행위, 성향 등을 파악하는데 활용될 수 있다. The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that built beforehand. In English, names begin with upper cases and are used with some words. In this paper, we propose a recognition method for main characters name in Korean novels by using predicates, rules and weights. We first recognize candidates for the characters name by predicates and propose some rules to exclude candidates that cannot be characters. We assign importances for candidates, considering weights that given by the number of candidates appeared in a sentence. Finally, if the importance of the character is more than a threshold, we decide that the character is one of main characters. The results from the experiments for 300 novels show that an average accuracy is 85.97%. The main characters name may be used to grasp relationships among characters, character's action and tendency. KCI Citation Count: 0
The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that built beforehand. In English, names begin with upper cases and are used with some words. In this paper, we propose a recognition method for main characters name in Korean novels by using predicates, rules and weights. We first recognize candidates for the characters name by predicates and propose some rules to exclude candidates that cannot be characters. We assign importances for candidates, considering weights that given by the number of candidates appeared in a sentence. Finally, if the importance of the character is more than a threshold, we decide that the character is one of main characters. The results from the experiments for 300 novels show that an average accuracy is 85.97%. The main characters name may be used to grasp relationships among characters, character's action and tendency. 소설에서 주요 인물은 소설의 이야기를 전개하는 아주 중요한 역할을 담당하여 소설에서 없어서는 안 되는 중심인물을 의미한다. 기존의 인물명 인식 연구에서는 구축해놓은 인물명 사전을 통해 인물명을 인식하였고, 영어의 경우 대소문자 구별이 있으며 인물명과 함께 사용되는 단어를 활용하여 인물명을 인식하였다. 본 논문에서는 한국어 소설에서 용언, 규칙 및 가중치를 이용한 주요 인물명 인식 기법에 대해 제안한다. 먼저, 인물이 행할 수 있는 용언을 근거로 인물명 후보를 인식하고, 인식된 인물명 후보 중 인물명으로 사용될 수 없는 규칙에 해당되는 후보들을 제거한다. 문장에 나타나는 인물명 후보의 수에 따라 가중치를 부여하여 중요도를 계산하고, 중요도가 임계치 이상인 경우 주요 인물명으로 판단한다. 소설 300권을 대상으로 실험 결과 평균 85.97%의 정확도를 보였다. 인식된 주요 인물명은 향후 소설내 등장인물 간 연관관계를 파악하거나 등장인물의 행위, 성향 등을 파악하는데 활용될 수 있다.
Author 김서희(Seo-Hee Kim)
김승훈(Seung-Hoon Kim)
박태근(Tae-Keun Park)
Author_xml – sequence: 1
  fullname: 김서희(Seo-Hee Kim)
– sequence: 2
  fullname: 박태근(Tae-Keun Park)
– sequence: 3
  fullname: 김승훈(Seung-Hoon Kim)
BackLink https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002082041$$DAccess content in National Research Foundation of Korea (NRF)
BookMark eNpFjDFLw0AYQINUsNb-hywODoH77nLJZSy1arVYkA5ux11yJ0dqKokO7tVFBwerIO2kkyiIKHToL2rP_2C1gtN7w-OtOqWsl6klp4wxY15EEC7NHSHqIQaHK061KIxEGBOCCYKyQ78Gw-nnq737cO3lte0_2fsb2x-69nFiH25dOxrPXiaz54sfs1cjdzp-m70P1pxlLbqFqv6x4nS2Gp36jtdqbzfrtZaXRj540vchSEIRSxYKImUAWigJ4AstmRJIYxYmcUQVEhjHmCZUCQKU6DhSmkhGKs7GYpvlmqex4T1hfnnU42nOawedJgdggBiat-uLNjXFqeFZUnT5bm2vjREEAFGAEQ19YP9ddpabY5UYwU_mIvJzvt_ebKAgYD4LgXwDtnVt9Q
ContentType Journal Article
DBID DBRKI
TDB
JDI
ACYCR
DEWEY 567
DatabaseName DBPIA - 디비피아
Nurimedia DBPIA Journals
KoreaScience
Korean Citation Index
DatabaseTitleList

DeliveryMethod fulltext_linktorsrc
Discipline Geology
DocumentTitleAlternate A Recognition Method for Main Characters Name in Korean Novels
DocumentTitle_FL A Recognition Method for Main Characters Name in Korean Novels
EISSN 2288-9302
EndPage 81
ExternalDocumentID oai_kci_go_kr_ARTI_1181080
JAKO201611962057418
NODE06684871
GroupedDBID .UV
ALMA_UNASSIGNED_HOLDINGS
DBRKI
TDB
JDI
ACYCR
M~E
ID FETCH-LOGICAL-k941-b4416d7acb87a3bb61faeb114afb8ea0f287dc95e0a22c25d5ea3153fc9ef3b83
ISSN 2005-081X
IngestDate Tue Nov 21 21:38:23 EST 2023
Fri Dec 22 11:59:18 EST 2023
Thu Feb 06 13:23:45 EST 2025
IsOpenAccess true
IsPeerReviewed false
IsScholarly false
Issue 1
Keywords Data Mining
Text Mining
Korean Novels
Korean Linguistic Feature
Main Characters
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-k941-b4416d7acb87a3bb61faeb114afb8ea0f287dc95e0a22c25d5ea3153fc9ef3b83
Notes KISTI1.1003/JNL.JAKO201611962057418
G704-SER000003092.2016.9.1.002
OpenAccessLink http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201611962057418&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
PageCount 7
ParticipantIDs nrf_kci_oai_kci_go_kr_ARTI_1181080
kisti_ndsl_JAKO201611962057418
nurimedia_primary_NODE06684871
PublicationCentury 2000
PublicationDate 2016
PublicationDateYYYYMMDD 2016-01-01
PublicationDate_xml – year: 2016
  text: 2016
PublicationDecade 2010
PublicationTitle 한국정보전자통신기술학회 논문지
PublicationTitleAlternate Journal of Korea institute of information, electronics, and communication technology
PublicationYear 2016
Publisher 한국정보전자통신기술학회
Publisher_xml – name: 한국정보전자통신기술학회
SSID ssib022332301
ssib023640390
ssib053377445
ssib044738261
ssib026777158
Score 1.5814956
Snippet The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that...
소설에서 주요 인물은 소설의 이야기를 전개하는 아주 중요한 역할을 담당하여 소설에서 없어서는 안 되는 중심인물을 의미한다. 기존의 인물명 인식 연구에서는 구축해놓은 인물명 사전을 통해 인물명을 인식하였고, 영어의 경우 대소문자 구별이 있으며 인물명과 함께 사용되는 단어를 활용하여...
SourceID nrf
kisti
nurimedia
SourceType Open Website
Open Access Repository
Publisher
StartPage 75
SubjectTerms 전자/정보통신공학
Title 한국어 소설에서 주요 인물명 인식 기법
URI https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE06684871
http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201611962057418&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002082041
Volume 9
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 한국정보전자통신기술학회 논문지, 2016, 9(1), , pp.75-81
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwvV29b9QwFLdKF1gQCBDlo4oQnqqgJHZie0xyQaWo7XJIt0X5RNWhu-q4WxiYCgsMDBQk1E4wIZAQAqlD_6Je-B94ti-XgA6pMLBET8_O87Of8_x7jj8Quu25qZeniWPKNbkmZdwyhZdZZkm4WySpJZJCBoqbW976A7rRc3tLZybt3SXj9E72ZOG-kn-xKvDArnKX7F9Ydi4UGECDfeEJFobnqWyMow4WLhYhjnwcuNjv4CjEwsMBXZMU9zAPFUGxT1Uaw8KacUSoMvkEByqT8LHQ74kODjiOAuyHKg0IH3O3nQYSAqDXVMkcB5bMFThY32VZw93FCvqWZMr8UDSdcbjWL1L6daTqkF8XA6lNKcDhiqMlC0WAdrIyAShZKxzO1PSZXMwBHUnII6laEx9KppCJdXMoUR3cnEapdNTKgkakrgfDQbhYiqKlFNCEtydU9E5P1fn_Z5s0bl6dBQvArKdHZM1zoKcLYjmtoUVfMFODFLsZv-s1C78N678cIN7PduKHw7g_iiFMuhfL3cYQKgByAXwqF0JuPo1qLwx4kUBcOvf68oYBizT_Uh2PMWY3_9IpZQRiVDmzMa8KRHoy_NkBwDYYAc47O5jIyyrA47XAW_cCOj-Lugxff0IX0VJ_eAm5P_YPTr5_rt58M6rnL6u9D9XbV9XegVG9P67evTaqw6Ppp-Ppx2eSql4cGidHX6Zf9y-j7t2oG66bs1tEzL6gtpkC3vdylmQpZwlJU88uE8AnNk3KlBeJVTqc5ZlwCytxnMxxc3BRBGBAmYmiJCknV9DyYDgoriIjyxhxC1K6HHB87kCgXZa0pODOvAICf7KCVlWt40H--FG84d_flt3LhjHOgaiI2nwF3YLmUMb4s1FAyry14l195Ey8td2JIDjglDP72mmkXEfnZOF6svAGWh6PJsVNgM_jdFVZ-yfBHJPh
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%ED%95%9C%EA%B5%AD%EC%96%B4+%EC%86%8C%EC%84%A4%EC%97%90%EC%84%9C+%EC%A3%BC%EC%9A%94+%EC%9D%B8%EB%AC%BC%EB%AA%85+%EC%9D%B8%EC%8B%9D+%EA%B8%B0%EB%B2%95&rft.jtitle=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%EC%A0%84%EC%9E%90%ED%86%B5%EC%8B%A0%EA%B8%B0%EC%88%A0%ED%95%99%ED%9A%8C+%EB%85%BC%EB%AC%B8%EC%A7%80%2C+9%281%29&rft.au=%EA%B9%80%EC%84%9C%ED%9D%AC&rft.au=%EB%B0%95%ED%83%9C%EA%B7%BC&rft.au=%EA%B9%80%EC%8A%B9%ED%9B%88&rft.date=2016&rft.pub=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%EC%A0%84%EC%9E%90%ED%86%B5%EC%8B%A0%EA%B8%B0%EC%88%A0%ED%95%99%ED%9A%8C&rft.issn=2005-081X&rft.eissn=2288-9302&rft.spage=75&rft.epage=81&rft.externalDBID=n%2Fa&rft.externalDocID=oai_kci_go_kr_ARTI_1181080
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2005-081X&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2005-081X&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2005-081X&client=summon