SNS에서 단어 간 유사도 기반 단어의 쾌-불쾌 지수 추정

감성 분석은 자연언어 처리 기술 및 텍스트마이닝 기술을 활용하여 텍스트 데이터로부터 주관적 정보를 인식 및 추출하는 기술로서, 분석하고자 하는 문서에 포함된 감성단어의 감성 지수를 이용하여 수행된다. 대다수의 감성 분석 연구에서는 감성단어를 긍정-부정의 두 가지로 분류하는 연구를 수행하였고, 최근에는 기쁨, 슬픔, 화남과 같이 다양한 감성으로 분류하는 연구들 역시 활발히 진행 중이다. 만약 감성 정도를 정량적으로 나타낼 수 있다면 보다 정밀한 감성 분석을 수행할 수 있겠지만, 단어의 감성 정도를 정량화하는 연구는 찾기 힘들다. 따라...

Full description

Saved in:

Bibliographic Details
Published in	정보과학회 컴퓨팅의 실제 논문지, 20(3) pp. 159 - 164
Main Authors	이강복, 백종범, 이수원
Format	Journal Article
Language	Korean
Published	한국정보과학회 01.03.2014
Subjects	컴퓨터학
Online Access	Get full text
ISSN	2383-6318 2383-6326

Cover

Abstract	감성 분석은 자연언어 처리 기술 및 텍스트마이닝 기술을 활용하여 텍스트 데이터로부터 주관적 정보를 인식 및 추출하는 기술로서, 분석하고자 하는 문서에 포함된 감성단어의 감성 지수를 이용하여 수행된다. 대다수의 감성 분석 연구에서는 감성단어를 긍정-부정의 두 가지로 분류하는 연구를 수행하였고, 최근에는 기쁨, 슬픔, 화남과 같이 다양한 감성으로 분류하는 연구들 역시 활발히 진행 중이다. 만약 감성 정도를 정량적으로 나타낼 수 있다면 보다 정밀한 감성 분석을 수행할 수 있겠지만, 단어의 감성 정도를 정량화하는 연구는 찾기 힘들다. 따라서 본 논문에서는 단어 간 유사도를 기반으로 신규 단어의 쾌-불쾌 지수를 추정하는 방법론을 제안한다. 제안 시스템은 전처리, 자질어 선택, 동시 출현 단어와의 연관성 계산, 단어 간 유사도 계산의 단계를 거쳐 최종적으로 쾌-불쾌 지수 자동 추정을 수행한다. 실험 결과 기존 방법들에 비해 좋은 성능을 보였다. Sentiment analysis is a technology that extracts subjective information from text data by using natural language processing and text mining. In general, sentiment analysis is conducted based on sentiment of words in a document. Most researches have considered only positive/negative as sentiment classes, while recently many researches consider more diverse sentiments such as happy, sad and angry. However, a problem is how to estimate a sentiment index of a word. In this paper, we propose a method to estimate pleasure-displeasure index of words using similarities between words. In order to automatically estimate pleasure-displeasure index, we conducted our experiment based on following steps: 1) preprocessing 2) feature selection 3) cooccurrence-word-based association analysis 4) word similarity calculation. The experimental results show that the proposed method performs better comparing with existing methods. KCI Citation Count: 6
AbstractList	감성 분석은 자연언어 처리 기술 및 텍스트마이닝 기술을 활용하여 텍스트 데이터로부터 주관적 정보를 인식 및 추출하는 기술로서, 분석하고자 하는 문서에 포함된 감성단어의 감성 지수를 이용하여 수행된다. 대다수의 감성 분석 연구에서는 감성단어를 긍정-부정의 두 가지로 분류하는 연구를 수행하였고, 최근에는 기쁨, 슬픔, 화남과 같이 다양한 감성으로 분류하는 연구들 역시 활발히 진행 중이다. 만약 감성 정도를 정량적으로 나타낼 수 있다면 보다 정밀한 감성 분석을 수행할 수 있겠지만, 단어의 감성 정도를 정량화하는 연구는 찾기 힘들다. 따라서 본 논문에서는 단어 간 유사도를 기반으로 신규 단어의 쾌-불쾌 지수를 추정하는 방법론을 제안한다. 제안 시스템은 전처리, 자질어 선택, 동시 출현 단어와의 연관성 계산, 단어 간 유사도 계산의 단계를 거쳐 최종적으로 쾌-불쾌 지수 자동 추정을 수행한다. 실험 결과 기존 방법들에 비해 좋은 성능을 보였다. Sentiment analysis is a technology that extracts subjective information from text data by using natural language processing and text mining. In general, sentiment analysis is conducted based on sentiment of words in a document. Most researches have considered only positive/negative as sentiment classes, while recently many researches consider more diverse sentiments such as happy, sad and angry. However, a problem is how to estimate a sentiment index of a word. In this paper, we propose a method to estimate pleasure-displeasure index of words using similarities between words. In order to automatically estimate pleasure-displeasure index, we conducted our experiment based on following steps: 1) preprocessing 2) feature selection 3) cooccurrence-word-based association analysis 4) word similarity calculation. The experimental results show that the proposed method performs better comparing with existing methods. KCI Citation Count: 6
Author	이강복 이수원 백종범
Author_xml	– sequence: 1 fullname: 이강복 organization: (숭실대학교 컴퓨터학과) – sequence: 2 fullname: 백종범 organization: (숭실대학교 컴퓨터학과) – sequence: 3 fullname: 이수원 organization: (숭실대학교)
BackLink	https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART001858217$$DAccess content in National Research Foundation of Korea (NRF)
BookMark	eNrjYmDJy89LZWLgNDK2MNY1MzYyY4GzDS04GHiLizOTDIwMLYxMLCwNORk8gv2C30yf8KZljsLr7hVvpm1ReLWhReHNnAVvmta87m9ReLVjw-sNM6Byb-bOUHizr0f39bYOIKXwZnnDmw6gyLYpbxZM5WFgTUvMKU7lhdLcDOpuriHOHrp5RWnx2cmZ8fmJmWA6PT8-uyjeMSjEM97MzNzM0ph4lQD8o1V8
ContentType	Journal Article
DBID	ACYCR
DatabaseName	Korean Citation Index
DatabaseTitleList
DeliveryMethod	fulltext_linktorsrc
DocumentTitleAlternate	Estimating a Pleasure-Displeasure Index of Word based on Word Similarity in SNS
EISSN	2383-6326
EndPage	164
ExternalDocumentID	oai_kci_go_kr_ARTI_66769
GroupedDBID	ACYCR ALMA_UNASSIGNED_HOLDINGS M~E
ID	FETCH-nrf_kci_oai_kci_go_kr_ARTI_667693
ISSN	2383-6318
IngestDate	Tue Nov 21 21:23:54 EST 2023
IsPeerReviewed	false
IsScholarly	false
Language	Korean
LinkModel	OpenURL
MergedId	FETCHMERGED-nrf_kci_oai_kci_go_kr_ARTI_667693
Notes	G704-A00398.2014.20.3.007
ParticipantIDs	nrf_kci_oai_kci_go_kr_ARTI_66769
PublicationCentury	2000
PublicationDate	2014-03
PublicationDateYYYYMMDD	2014-03-01
PublicationDate_xml	– month: 03 year: 2014 text: 2014-03
PublicationDecade	2010
PublicationTitle	정보과학회 컴퓨팅의 실제 논문지, 20(3)
PublicationYear	2014
Publisher	한국정보과학회
Publisher_xml	– name: 한국정보과학회
SSID	ssib021824891 ssib044742771 ssib019653237
Score	3.0560188
Snippet	감성 분석은 자연언어 처리 기술 및 텍스트마이닝 기술을 활용하여 텍스트 데이터로부터 주관적 정보를 인식 및 추출하는 기술로서, 분석하고자 하는 문서에 포함된 감성단어의 감성 지수를 이용하여 수행된다. 대다수의 감성 분석 연구에서는 감성단어를 긍정-부정의 두 가지로 분류하는 연구를...
SourceID	nrf
SourceType	Open Website
StartPage	159
SubjectTerms	컴퓨터학
Title	SNS에서 단어 간 유사도 기반 단어의 쾌-불쾌 지수 추정
URI	https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART001858217
hasFullText	1
inHoldings	1
isFullTextHit
isPrint
ispartofPNX	정보과학회 컴퓨팅의 실제 논문지, 2014, 20(3), , pp.159-164
link	http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwnV29b9QwFLd6nVgQCBDfyoDFUAVdYidnj3Eu1YHULi1St1PSpAiddCddrwsDQuiGSiDBwEeHInWDgeEGVDHxB_X8R_D88nnoUCmLY_3e0_OzX5z3bDnPhDxw9zKWZA6zGfhXm6dp25aJJ-1EyDiW3E8TvJJlY9PvPeVPdrydldZ-49TSwSR5tPti6X8l_2NVwMCu5i_ZC1i2EgoA1MG-UIKFofwnG29tbtEopLJDZdtUBKcyXKORokLRQCDNp4oDFFDVBvoaYiENcn6XBiGyr-c04BKGESAopVgiCyvdnBZSFVER2sjvUyEqCIlBx5yjMO2Iit-nEkWAAvm1l2VkXIEojGFLAVZAw67BpcRKUIpXCpkAYqhgFwhUeIsKGuWrBoux8VCmMn1XolYUXjYXStHcey6EFco01fNqFhws5aAkFzUAxKWSL5FSDAYiiuZ3mJa7Lg6vj53hPCk7HmLrHg26Fxql-iMPEROzfVb4oKyJuU3H4hR50_MYxckzvy-mD__DrS8kEB_sPu8_G_UH4z4skx738WBzi7SYY1zDxsuo_ASb_JKskb7I5Pfnok6nxHmHux3cxqg0h6hsON5rRGXbV8jlYjllBfncuEpWBqNrpAfzQn9-r6fH1vzNN_3ph3U2m1r6-ES__j5_N7XOfs7ms6OCpr8cWfrXW3t-eggPS399pQ8BOf2gTz5eJw_Xo-2wZ0PL2Lm_dZLdIKvD0TC7SSwZJ3EWdyAENzktRSwTE_9DFNeOU5lKeYtY50m7fT7LHXKpfl_uktXJ-CC7B3HrJLmPI_0bpGxzjw
linkProvider	ISSN International Centre
openUrl	ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=SNS%EC%97%90%EC%84%9C+%EB%8B%A8%EC%96%B4+%EA%B0%84+%EC%9C%A0%EC%82%AC%EB%8F%84+%EA%B8%B0%EB%B0%98+%EB%8B%A8%EC%96%B4%EC%9D%98+%EC%BE%8C-%EB%B6%88%EC%BE%8C+%EC%A7%80%EC%88%98+%EC%B6%94%EC%A0%95&rft.jtitle=%EC%A0%95%EB%B3%B4%EA%B3%BC%ED%95%99%ED%9A%8C+%EC%BB%B4%ED%93%A8%ED%8C%85%EC%9D%98+%EC%8B%A4%EC%A0%9C+%EB%85%BC%EB%AC%B8%EC%A7%80%2C+20%283%29&rft.au=%EC%9D%B4%EA%B0%95%EB%B3%B5&rft.au=%EB%B0%B1%EC%A2%85%EB%B2%94&rft.au=%EC%9D%B4%EC%88%98%EC%9B%90&rft.date=2014-03-01&rft.pub=%ED%95%9C%EA%B5%AD%EC%A0%95%EB%B3%B4%EA%B3%BC%ED%95%99%ED%9A%8C&rft.issn=2383-6318&rft.eissn=2383-6326&rft.spage=159&rft.epage=164&rft.externalDBID=n%2Fa&rft.externalDocID=oai_kci_go_kr_ARTI_66769
thumbnail_l	http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2383-6318&client=summon
thumbnail_m	http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2383-6318&client=summon
thumbnail_s	http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2383-6318&client=summon