SNS에서 단어 간 유사도 기반 단어의 쾌-불쾌 지수 추정
감성 분석은 자연언어 처리 기술 및 텍스트마이닝 기술을 활용하여 텍스트 데이터로부터 주관적 정보를 인식 및 추출하는 기술로서, 분석하고자 하는 문서에 포함된 감성단어의 감성 지수를 이용하여 수행된다. 대다수의 감성 분석 연구에서는 감성단어를 긍정-부정의 두 가지로 분류하는 연구를 수행하였고, 최근에는 기쁨, 슬픔, 화남과 같이 다양한 감성으로 분류하는 연구들 역시 활발히 진행 중이다. 만약 감성 정도를 정량적으로 나타낼 수 있다면 보다 정밀한 감성 분석을 수행할 수 있겠지만, 단어의 감성 정도를 정량화하는 연구는 찾기 힘들다. 따라...
Saved in:
Published in | 정보과학회 컴퓨팅의 실제 논문지, 20(3) pp. 159 - 164 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Korean |
Published |
한국정보과학회
01.03.2014
|
Subjects | |
Online Access | Get full text |
ISSN | 2383-6318 2383-6326 |
Cover
Abstract | 감성 분석은 자연언어 처리 기술 및 텍스트마이닝 기술을 활용하여 텍스트 데이터로부터 주관적 정보를 인식 및 추출하는 기술로서, 분석하고자 하는 문서에 포함된 감성단어의 감성 지수를 이용하여 수행된다. 대다수의 감성 분석 연구에서는 감성단어를 긍정-부정의 두 가지로 분류하는 연구를 수행하였고, 최근에는 기쁨, 슬픔, 화남과 같이 다양한 감성으로 분류하는 연구들 역시 활발히 진행 중이다. 만약 감성 정도를 정량적으로 나타낼 수 있다면 보다 정밀한 감성 분석을 수행할 수 있겠지만, 단어의 감성 정도를 정량화하는 연구는 찾기 힘들다. 따라서 본 논문에서는 단어 간 유사도를 기반으로 신규 단어의 쾌-불쾌 지수를 추정하는 방법론을 제안한다. 제안 시스템은 전처리, 자질어 선택, 동시 출현 단어와의 연관성 계산, 단어 간 유사도 계산의 단계를 거쳐 최종적으로 쾌-불쾌 지수 자동 추정을 수행한다. 실험 결과 기존 방법들에 비해 좋은 성능을 보였다. Sentiment analysis is a technology that extracts subjective information from text data by using natural language processing and text mining. In general, sentiment analysis is conducted based on sentiment of words in a document. Most researches have considered only positive/negative as sentiment classes, while recently many researches consider more diverse sentiments such as happy, sad and angry. However, a problem is how to estimate a sentiment index of a word. In this paper, we propose a method to estimate pleasure-displeasure index of words using similarities between words. In order to automatically estimate pleasure-displeasure index, we conducted our experiment based on following steps: 1) preprocessing 2) feature selection 3) cooccurrence-word-based association analysis 4) word similarity calculation. The experimental results show that the proposed method performs better comparing with existing methods. KCI Citation Count: 6 |
---|---|
AbstractList | 감성 분석은 자연언어 처리 기술 및 텍스트마이닝 기술을 활용하여 텍스트 데이터로부터 주관적 정보를 인식 및 추출하는 기술로서, 분석하고자 하는 문서에 포함된 감성단어의 감성 지수를 이용하여 수행된다. 대다수의 감성 분석 연구에서는 감성단어를 긍정-부정의 두 가지로 분류하는 연구를 수행하였고, 최근에는 기쁨, 슬픔, 화남과 같이 다양한 감성으로 분류하는 연구들 역시 활발히 진행 중이다. 만약 감성 정도를 정량적으로 나타낼 수 있다면 보다 정밀한 감성 분석을 수행할 수 있겠지만, 단어의 감성 정도를 정량화하는 연구는 찾기 힘들다. 따라서 본 논문에서는 단어 간 유사도를 기반으로 신규 단어의 쾌-불쾌 지수를 추정하는 방법론을 제안한다. 제안 시스템은 전처리, 자질어 선택, 동시 출현 단어와의 연관성 계산, 단어 간 유사도 계산의 단계를 거쳐 최종적으로 쾌-불쾌 지수 자동 추정을 수행한다. 실험 결과 기존 방법들에 비해 좋은 성능을 보였다. Sentiment analysis is a technology that extracts subjective information from text data by using natural language processing and text mining. In general, sentiment analysis is conducted based on sentiment of words in a document. Most researches have considered only positive/negative as sentiment classes, while recently many researches consider more diverse sentiments such as happy, sad and angry. However, a problem is how to estimate a sentiment index of a word. In this paper, we propose a method to estimate pleasure-displeasure index of words using similarities between words. In order to automatically estimate pleasure-displeasure index, we conducted our experiment based on following steps: 1) preprocessing 2) feature selection 3) cooccurrence-word-based association analysis 4) word similarity calculation. The experimental results show that the proposed method performs better comparing with existing methods. KCI Citation Count: 6 |
Author | 이강복 이수원 백종범 |
Author_xml | – sequence: 1 fullname: 이강복 organization: (숭실대학교 컴퓨터학과) – sequence: 2 fullname: 백종범 organization: (숭실대학교 컴퓨터학과) – sequence: 3 fullname: 이수원 organization: (숭실대학교) |
BackLink | https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART001858217$$DAccess content in National Research Foundation of Korea (NRF) |
BookMark | eNrjYmDJy89LZWLgNDK2MNY1MzYyY4GzDS04GHiLizOTDIwMLYxMLCwNORk8gv2C30yf8KZljsLr7hVvpm1ReLWhReHNnAVvmta87m9ReLVjw-sNM6Byb-bOUHizr0f39bYOIKXwZnnDmw6gyLYpbxZM5WFgTUvMKU7lhdLcDOpuriHOHrp5RWnx2cmZ8fmJmWA6PT8-uyjeMSjEM97MzNzM0ph4lQD8o1V8 |
ContentType | Journal Article |
DBID | ACYCR |
DatabaseName | Korean Citation Index |
DatabaseTitleList | |
DeliveryMethod | fulltext_linktorsrc |
DocumentTitleAlternate | Estimating a Pleasure-Displeasure Index of Word based on Word Similarity in SNS |
EISSN | 2383-6326 |
EndPage | 164 |
ExternalDocumentID | oai_kci_go_kr_ARTI_66769 |
GroupedDBID | ACYCR ALMA_UNASSIGNED_HOLDINGS M~E |
ID | FETCH-nrf_kci_oai_kci_go_kr_ARTI_667693 |
ISSN | 2383-6318 |
IngestDate | Tue Nov 21 21:23:54 EST 2023 |
IsPeerReviewed | false |
IsScholarly | false |
Language | Korean |
LinkModel | OpenURL |
MergedId | FETCHMERGED-nrf_kci_oai_kci_go_kr_ARTI_667693 |
Notes | G704-A00398.2014.20.3.007 |
ParticipantIDs | nrf_kci_oai_kci_go_kr_ARTI_66769 |
PublicationCentury | 2000 |
PublicationDate | 2014-03 |
PublicationDateYYYYMMDD | 2014-03-01 |
PublicationDate_xml | – month: 03 year: 2014 text: 2014-03 |
PublicationDecade | 2010 |
PublicationTitle | 정보과학회 컴퓨팅의 실제 논문지, 20(3) |
PublicationYear | 2014 |
Publisher | 한국정보과학회 |
Publisher_xml | – name: 한국정보과학회 |
SSID | ssib021824891 ssib044742771 ssib019653237 |
Score | 3.0560188 |
Snippet | 감성 분석은 자연언어 처리 기술 및 텍스트마이닝 기술을 활용하여 텍스트 데이터로부터 주관적 정보를 인식 및 추출하는 기술로서, 분석하고자 하는 문서에 포함된 감성단어의 감성 지수를 이용하여 수행된다. 대다수의 감성 분석 연구에서는 감성단어를 긍정-부정의 두 가지로 분류하는 연구를... |
SourceID | nrf |
SourceType | Open Website |
StartPage | 159 |
SubjectTerms | 컴퓨터학 |
Title | SNS에서 단어 간 유사도 기반 단어의 쾌-불쾌 지수 추정 |
URI | https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART001858217 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
ispartofPNX | 정보과학회 컴퓨팅의 실제 논문지, 2014, 20(3), , pp.159-164 |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV29b9QwFLd6nVgQCBDfyoDFUAVdYidnj3Eu1YHULi1St1PSpAiddCddrwsDQuiGSiDBwEeHInWDgeEGVDHxB_X8R_D88nnoUCmLY_3e0_OzX5z3bDnPhDxw9zKWZA6zGfhXm6dp25aJJ-1EyDiW3E8TvJJlY9PvPeVPdrydldZ-49TSwSR5tPti6X8l_2NVwMCu5i_ZC1i2EgoA1MG-UIKFofwnG29tbtEopLJDZdtUBKcyXKORokLRQCDNp4oDFFDVBvoaYiENcn6XBiGyr-c04BKGESAopVgiCyvdnBZSFVER2sjvUyEqCIlBx5yjMO2Iit-nEkWAAvm1l2VkXIEojGFLAVZAw67BpcRKUIpXCpkAYqhgFwhUeIsKGuWrBoux8VCmMn1XolYUXjYXStHcey6EFco01fNqFhws5aAkFzUAxKWSL5FSDAYiiuZ3mJa7Lg6vj53hPCk7HmLrHg26Fxql-iMPEROzfVb4oKyJuU3H4hR50_MYxckzvy-mD__DrS8kEB_sPu8_G_UH4z4skx738WBzi7SYY1zDxsuo_ASb_JKskb7I5Pfnok6nxHmHux3cxqg0h6hsON5rRGXbV8jlYjllBfncuEpWBqNrpAfzQn9-r6fH1vzNN_3ph3U2m1r6-ES__j5_N7XOfs7ms6OCpr8cWfrXW3t-eggPS399pQ8BOf2gTz5eJw_Xo-2wZ0PL2Lm_dZLdIKvD0TC7SSwZJ3EWdyAENzktRSwTE_9DFNeOU5lKeYtY50m7fT7LHXKpfl_uktXJ-CC7B3HrJLmPI_0bpGxzjw |
linkProvider | ISSN International Centre |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=SNS%EC%97%90%EC%84%9C+%EB%8B%A8%EC%96%B4+%EA%B0%84+%EC%9C%A0%EC%82%AC%EB%8F%84+%EA%B8%B0%EB%B0%98+%EB%8B%A8%EC%96%B4%EC%9D%98+%EC%BE%8C-%EB%B6%88%EC%BE%8C+%EC%A7%80%EC%88%98+%EC%B6%94%EC%A0%95&rft.jtitle=%EC%A0%95%EB%B3%B4%EA%B3%BC%ED%95%99%ED%9A%8C+%EC%BB%B4%ED%93%A8%ED%8C%85%EC%9D%98+%EC%8B%A4%EC%A0%9C+%EB%85%BC%EB%AC%B8%EC%A7%80%2C+20%283%29&rft.au=%EC%9D%B4%EA%B0%95%EB%B3%B5&rft.au=%EB%B0%B1%EC%A2%85%EB%B2%94&rft.au=%EC%9D%B4%EC%88%98%EC%9B%90&rft.date=2014-03-01&rft.pub=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%EA%B3%BC%ED%95%99%ED%9A%8C&rft.issn=2383-6318&rft.eissn=2383-6326&rft.spage=159&rft.epage=164&rft.externalDBID=n%2Fa&rft.externalDocID=oai_kci_go_kr_ARTI_66769 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2383-6318&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2383-6318&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2383-6318&client=summon |