한국어 소설에서 주요 인물명 인식 기법
The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that built beforehand. In English, names begin with upper cases and are used with some words. In this paper, we propose a recognition method for main...
Saved in:
Published in | 한국정보전자통신기술학회 논문지 Vol. 9; no. 1; pp. 75 - 81 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Korean |
Published |
한국정보전자통신기술학회
2016
|
Subjects | |
Online Access | Get full text |
ISSN | 2005-081X 2288-9302 |
Cover
Abstract | The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that built beforehand. In English, names begin with upper cases and are used with some words. In this paper, we propose a recognition method for main characters name in Korean novels by using predicates, rules and weights. We first recognize candidates for the characters name by predicates and propose some rules to exclude candidates that cannot be characters. We assign importances for candidates, considering weights that given by the number of candidates appeared in a sentence. Finally, if the importance of the character is more than a threshold, we decide that the character is one of main characters. The results from the experiments for 300 novels show that an average accuracy is 85.97%. The main characters name may be used to grasp relationships among characters, character's action and tendency. 소설에서 주요 인물은 소설의 이야기를 전개하는 아주 중요한 역할을 담당하여 소설에서 없어서는 안 되는 중심인물을 의미한다. 기존의 인물명 인식 연구에서는 구축해놓은 인물명 사전을 통해 인물명을 인식하였고, 영어의 경우 대소문자 구별이 있으며 인물명과 함께 사용되는 단어를 활용하여 인물명을 인식하였다. 본 논문에서는 한국어 소설에서 용언, 규칙 및 가중치를 이용한 주요 인물명 인식 기법에 대해 제안한다. 먼저, 인물이 행할 수 있는 용언을 근거로 인물명 후보를 인식하고, 인식된 인물명 후보 중 인물명으로 사용될 수 없는 규칙에 해당되는 후보들을 제거한다. 문장에 나타나는 인물명 후보의 수에 따라 가중치를 부여하여 중요도를 계산하고, 중요도가 임계치 이상인 경우 주요 인물명으로 판단한다. 소설 300권을 대상으로 실험 결과 평균 85.97%의 정확도를 보였다. 인식된 주요 인물명은 향후 소설내 등장인물 간 연관관계를 파악하거나 등장인물의 행위, 성향 등을 파악하는데 활용될 수 있다. |
---|---|
AbstractList | 소설에서 주요 인물은 소설의 이야기를 전개하는 아주 중요한 역할을 담당하여 소설에서 없어서는 안 되는 중심인물을 의미한다. 기존의 인물명 인식 연구에서는 구축해놓은 인물명 사전을 통해 인물명을 인식하였고, 영어의 경우 대소문자 구별이 있으며 인물명과 함께 사용되는 단어를 활용하여 인물명을 인식하였다. 본 논문에서는 한국어 소설에서 용언, 규칙 및 가중치를 이용한 주요 인물명 인식 기법에 대해 제안한다. 먼저, 인물이 행할 수 있는 용언을 근거로 인물명 후보를 인식하고, 인식된 인물명 후보 중 인물명으로 사용될 수 없는 규칙에 해당되는 후보들을 제거한다. 문장에 나타나는 인물명 후보의 수에 따라 가중치를 부여하여 중요도를 계산하고, 중요도가 임계치 이상인 경우 주요 인물명으로 판단한다. 소설 300권을 대상으로 실험 결과 평균 85.97%의 정확도를 보였다. 인식된 주요 인물명은 향후 소설 내 등장인물 간 연관관계를 파악하거나 등장인물의 행위, 성향 등을 파악하는데 활용될 수 있다. The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that built beforehand. In English, names begin with upper cases and are used with some words. In this paper, we propose a recognition method for main characters name in Korean novels by using predicates, rules and weights. We first recognize candidates for the characters name by predicates and propose some rules to exclude candidates that cannot be characters. We assign importances for candidates, considering weights that given by the number of candidates appeared in a sentence. Finally, if the importance of the character is more than a threshold, we decide that the character is one of main characters. The results from the experiments for 300 novels show that an average accuracy is 85.97%. The main characters name may be used to grasp relationships among characters, character's action and tendency. KCI Citation Count: 0 The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that built beforehand. In English, names begin with upper cases and are used with some words. In this paper, we propose a recognition method for main characters name in Korean novels by using predicates, rules and weights. We first recognize candidates for the characters name by predicates and propose some rules to exclude candidates that cannot be characters. We assign importances for candidates, considering weights that given by the number of candidates appeared in a sentence. Finally, if the importance of the character is more than a threshold, we decide that the character is one of main characters. The results from the experiments for 300 novels show that an average accuracy is 85.97%. The main characters name may be used to grasp relationships among characters, character's action and tendency. 소설에서 주요 인물은 소설의 이야기를 전개하는 아주 중요한 역할을 담당하여 소설에서 없어서는 안 되는 중심인물을 의미한다. 기존의 인물명 인식 연구에서는 구축해놓은 인물명 사전을 통해 인물명을 인식하였고, 영어의 경우 대소문자 구별이 있으며 인물명과 함께 사용되는 단어를 활용하여 인물명을 인식하였다. 본 논문에서는 한국어 소설에서 용언, 규칙 및 가중치를 이용한 주요 인물명 인식 기법에 대해 제안한다. 먼저, 인물이 행할 수 있는 용언을 근거로 인물명 후보를 인식하고, 인식된 인물명 후보 중 인물명으로 사용될 수 없는 규칙에 해당되는 후보들을 제거한다. 문장에 나타나는 인물명 후보의 수에 따라 가중치를 부여하여 중요도를 계산하고, 중요도가 임계치 이상인 경우 주요 인물명으로 판단한다. 소설 300권을 대상으로 실험 결과 평균 85.97%의 정확도를 보였다. 인식된 주요 인물명은 향후 소설내 등장인물 간 연관관계를 파악하거나 등장인물의 행위, 성향 등을 파악하는데 활용될 수 있다. |
Author | 김서희(Seo-Hee Kim) 김승훈(Seung-Hoon Kim) 박태근(Tae-Keun Park) |
Author_xml | – sequence: 1 fullname: 김서희(Seo-Hee Kim) – sequence: 2 fullname: 박태근(Tae-Keun Park) – sequence: 3 fullname: 김승훈(Seung-Hoon Kim) |
BackLink | https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002082041$$DAccess content in National Research Foundation of Korea (NRF) |
BookMark | eNpFjDFLw0AYQINUsNb-hywODoH77nLJZSy1arVYkA5ux11yJ0dqKokO7tVFBwerIO2kkyiIKHToL2rP_2C1gtN7w-OtOqWsl6klp4wxY15EEC7NHSHqIQaHK061KIxEGBOCCYKyQ78Gw-nnq737cO3lte0_2fsb2x-69nFiH25dOxrPXiaz54sfs1cjdzp-m70P1pxlLbqFqv6x4nS2Gp36jtdqbzfrtZaXRj540vchSEIRSxYKImUAWigJ4AstmRJIYxYmcUQVEhjHmCZUCQKU6DhSmkhGKs7GYpvlmqex4T1hfnnU42nOawedJgdggBiat-uLNjXFqeFZUnT5bm2vjREEAFGAEQ19YP9ddpabY5UYwU_mIvJzvt_ebKAgYD4LgXwDtnVt9Q |
ContentType | Journal Article |
DBID | DBRKI TDB JDI ACYCR |
DEWEY | 567 |
DatabaseName | DBPIA - 디비피아 Nurimedia DBPIA Journals KoreaScience Korean Citation Index |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
Discipline | Geology |
DocumentTitleAlternate | A Recognition Method for Main Characters Name in Korean Novels |
DocumentTitle_FL | A Recognition Method for Main Characters Name in Korean Novels |
EISSN | 2288-9302 |
EndPage | 81 |
ExternalDocumentID | oai_kci_go_kr_ARTI_1181080 JAKO201611962057418 NODE06684871 |
GroupedDBID | .UV ALMA_UNASSIGNED_HOLDINGS DBRKI TDB JDI ACYCR M~E |
ID | FETCH-LOGICAL-k941-b4416d7acb87a3bb61faeb114afb8ea0f287dc95e0a22c25d5ea3153fc9ef3b83 |
ISSN | 2005-081X |
IngestDate | Tue Nov 21 21:38:23 EST 2023 Fri Dec 22 11:59:18 EST 2023 Thu Feb 06 13:23:45 EST 2025 |
IsOpenAccess | true |
IsPeerReviewed | false |
IsScholarly | false |
Issue | 1 |
Keywords | Data Mining Text Mining Korean Novels Korean Linguistic Feature Main Characters |
Language | Korean |
LinkModel | OpenURL |
MergedId | FETCHMERGED-LOGICAL-k941-b4416d7acb87a3bb61faeb114afb8ea0f287dc95e0a22c25d5ea3153fc9ef3b83 |
Notes | KISTI1.1003/JNL.JAKO201611962057418 G704-SER000003092.2016.9.1.002 |
OpenAccessLink | http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201611962057418&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01 |
PageCount | 7 |
ParticipantIDs | nrf_kci_oai_kci_go_kr_ARTI_1181080 kisti_ndsl_JAKO201611962057418 nurimedia_primary_NODE06684871 |
PublicationCentury | 2000 |
PublicationDate | 2016 |
PublicationDateYYYYMMDD | 2016-01-01 |
PublicationDate_xml | – year: 2016 text: 2016 |
PublicationDecade | 2010 |
PublicationTitle | 한국정보전자통신기술학회 논문지 |
PublicationTitleAlternate | Journal of Korea institute of information, electronics, and communication technology |
PublicationYear | 2016 |
Publisher | 한국정보전자통신기술학회 |
Publisher_xml | – name: 한국정보전자통신기술학회 |
SSID | ssib022332301 ssib023640390 ssib053377445 ssib044738261 ssib026777158 |
Score | 1.5814956 |
Snippet | The main characters play leading roles in novels. In the previous studies, they recognize the main characters in a novel mainly based on dictionaries that... 소설에서 주요 인물은 소설의 이야기를 전개하는 아주 중요한 역할을 담당하여 소설에서 없어서는 안 되는 중심인물을 의미한다. 기존의 인물명 인식 연구에서는 구축해놓은 인물명 사전을 통해 인물명을 인식하였고, 영어의 경우 대소문자 구별이 있으며 인물명과 함께 사용되는 단어를 활용하여... |
SourceID | nrf kisti nurimedia |
SourceType | Open Website Open Access Repository Publisher |
StartPage | 75 |
SubjectTerms | 전자/정보통신공학 |
Title | 한국어 소설에서 주요 인물명 인식 기법 |
URI | https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE06684871 http://click.ndsl.kr/servlet/LinkingDetailView?cn=JAKO201611962057418&dbt=JAKO&org_code=O481&site_code=SS1481&service_code=01 https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002082041 |
Volume | 9 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
ispartofPNX | 한국정보전자통신기술학회 논문지, 2016, 9(1), , pp.75-81 |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwvV29b9QwFLdKF1gQCBDlo4oQnqqgJHZie0xyQaWo7XJIt0X5RNWhu-q4WxiYCgsMDBQk1E4wIZAQAqlD_6Je-B94ti-XgA6pMLBET8_O87Of8_x7jj8Quu25qZeniWPKNbkmZdwyhZdZZkm4WySpJZJCBoqbW976A7rRc3tLZybt3SXj9E72ZOG-kn-xKvDArnKX7F9Ydi4UGECDfeEJFobnqWyMow4WLhYhjnwcuNjv4CjEwsMBXZMU9zAPFUGxT1Uaw8KacUSoMvkEByqT8LHQ74kODjiOAuyHKg0IH3O3nQYSAqDXVMkcB5bMFThY32VZw93FCvqWZMr8UDSdcbjWL1L6daTqkF8XA6lNKcDhiqMlC0WAdrIyAShZKxzO1PSZXMwBHUnII6laEx9KppCJdXMoUR3cnEapdNTKgkakrgfDQbhYiqKlFNCEtydU9E5P1fn_Z5s0bl6dBQvArKdHZM1zoKcLYjmtoUVfMFODFLsZv-s1C78N678cIN7PduKHw7g_iiFMuhfL3cYQKgByAXwqF0JuPo1qLwx4kUBcOvf68oYBizT_Uh2PMWY3_9IpZQRiVDmzMa8KRHoy_NkBwDYYAc47O5jIyyrA47XAW_cCOj-Lugxff0IX0VJ_eAm5P_YPTr5_rt58M6rnL6u9D9XbV9XegVG9P67evTaqw6Ppp-Ppx2eSql4cGidHX6Zf9y-j7t2oG66bs1tEzL6gtpkC3vdylmQpZwlJU88uE8AnNk3KlBeJVTqc5ZlwCytxnMxxc3BRBGBAmYmiJCknV9DyYDgoriIjyxhxC1K6HHB87kCgXZa0pODOvAICf7KCVlWt40H--FG84d_flt3LhjHOgaiI2nwF3YLmUMb4s1FAyry14l195Ey8td2JIDjglDP72mmkXEfnZOF6svAGWh6PJsVNgM_jdFVZ-yfBHJPh |
linkProvider | ISSN International Centre |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=%ED%95%9C%EA%B5%AD%EC%96%B4+%EC%86%8C%EC%84%A4%EC%97%90%EC%84%9C+%EC%A3%BC%EC%9A%94+%EC%9D%B8%EB%AC%BC%EB%AA%85+%EC%9D%B8%EC%8B%9D+%EA%B8%B0%EB%B2%95&rft.jtitle=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%EC%A0%84%EC%9E%90%ED%86%B5%EC%8B%A0%EA%B8%B0%EC%88%A0%ED%95%99%ED%9A%8C+%EB%85%BC%EB%AC%B8%EC%A7%80%2C+9%281%29&rft.au=%EA%B9%80%EC%84%9C%ED%9D%AC&rft.au=%EB%B0%95%ED%83%9C%EA%B7%BC&rft.au=%EA%B9%80%EC%8A%B9%ED%9B%88&rft.date=2016&rft.pub=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%EC%A0%84%EC%9E%90%ED%86%B5%EC%8B%A0%EA%B8%B0%EC%88%A0%ED%95%99%ED%9A%8C&rft.issn=2005-081X&rft.eissn=2288-9302&rft.spage=75&rft.epage=81&rft.externalDBID=n%2Fa&rft.externalDocID=oai_kci_go_kr_ARTI_1181080 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2005-081X&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2005-081X&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2005-081X&client=summon |