KoBERT, KoGPT-2, KoBART 활용 및 하이퍼파라미터 최적화를 진행한 리뷰 감성분석 애플리케이션 구현

응용 프로그램 배포 플랫폼에서 제공되는 사용자 리뷰와 별점은 애플리케이션의 다운로드 횟수에 큰 영향을 미치기 때문에, 개발자들은 리뷰를 통해 사용자들의 피드백을 받아들이고 애플리케이션을 업데이트한다. 그러나 사용자가 원하는 것을 알기 위해서는 리뷰를 모두 읽어야만 하는 불편함이 있다. 이를 개선하기 위해 리뷰 데이터셋을 분석하고, 그 결과를 개발자에게 보여주려고 한다. 데이터셋을 정제한 후, 모델의 하이퍼파라미터 변경을 통한 파인튜닝을 진행하였다. 카카오톡과 인스타그램 리뷰를 크롤링해 초기 데이터셋을 생성하고, KoBERT와 KoG...

Full description

Saved in:
Bibliographic Details
Published in디지털콘텐츠학회논문지 Vol. 24; no. 11; pp. 2831 - 2840
Main Authors 이민아(Min-A Lee), 박연지(Yeon-Ji Park), 나준영(Jun-Yeong Na), 손채봉(Chae-Bong Sohn)
Format Journal Article
LanguageKorean
Published 한국디지털콘텐츠학회 01.11.2023
Subjects
Online AccessGet full text
ISSN1598-2009
2287-738X
DOI10.9728/dcs.2023.24.11.2831

Cover

Abstract 응용 프로그램 배포 플랫폼에서 제공되는 사용자 리뷰와 별점은 애플리케이션의 다운로드 횟수에 큰 영향을 미치기 때문에, 개발자들은 리뷰를 통해 사용자들의 피드백을 받아들이고 애플리케이션을 업데이트한다. 그러나 사용자가 원하는 것을 알기 위해서는 리뷰를 모두 읽어야만 하는 불편함이 있다. 이를 개선하기 위해 리뷰 데이터셋을 분석하고, 그 결과를 개발자에게 보여주려고 한다. 데이터셋을 정제한 후, 모델의 하이퍼파라미터 변경을 통한 파인튜닝을 진행하였다. 카카오톡과 인스타그램 리뷰를 크롤링해 초기 데이터셋을 생성하고, KoBERT와 KoGPT-2, KoBART 모델을 사용한 감성분석을 진행하였다. 정제한 데이터셋으로 각 모델 별 재학습을 진행해 보았고, 모델의 하이퍼파라미터를 변경해보며 학습을 진행하였다. 초기 데이터로 진행한 감성분석의 정확도가 약 74%가 나온 반면, 데이터 정제와 모델의 하이퍼파라미터 보정 후 정확도가 약 89%로 약 15% 증가함을 볼 수 있다. 그 후 감성분석 성능이 가장 높은 모델을 사용하여 리뷰를 선택해 참고할 수 있게 하고자 애플리케이션을 개발하였다. 해당 애플리케이션을 사용함으로써 개발자가 사용자의 만족도를 높이는 방향으로 업그레이드하도록 도움을 줄 것이라 기대한다. User reviews and ratings available on application distribution platforms have a significant impact on the number of downloads an application receives, so developers rely on reviews to get feedback from users and update their applications. However, it is inconvenient to read all the reviews to know what users want. To improve this, we want to analyze the review dataset and show the results to developers. After cleaning the dataset, we proceeded to fine-tune the model by changing the hyperparameters. We created an initial dataset by crawling KakaoTalk and Instagram reviews, and conducted sentiment analysis using KoBERT, KoGPT-2, and KoBART models. We retrained each model with the purified dataset and changed the hyperparameters of the models to improve the learning. While the accuracy of sentiment analysis with the initial data was about 74%, we can see that the accuracy increased by about 15% to about 89% after data purification and model hyperparameter correction. We then developed an application to select and reference reviews using the model with the highest sentiment analysis performance. By using this application, we hope to help developers upgrade to improve user satisfaction. KCI Citation Count: 0
AbstractList 응용 프로그램 배포 플랫폼에서 제공되는 사용자 리뷰와 별점은 애플리케이션의 다운로드 횟수에 큰 영향을 미치기 때문에, 개발자들은 리뷰를 통해 사용자들의 피드백을 받아들이고 애플리케이션을 업데이트한다. 그러나 사용자가 원하는 것을 알기 위해서는 리뷰를 모두 읽어야만 하는 불편함이 있다. 이를 개선하기 위해 리뷰 데이터셋을 분석하고, 그 결과를 개발자에게 보여주려고 한다. 데이터셋을 정제한 후, 모델의 하이퍼파라미터 변경을 통한 파인튜닝을 진행하였다. 카카오톡과 인스타그램 리뷰를 크롤링해 초기 데이터셋을 생성하고, KoBERT와 KoGPT-2, KoBART 모델을 사용한 감성분석을 진행하였다. 정제한 데이터셋으로 각 모델 별 재학습을 진행해 보았고, 모델의 하이퍼파라미터를 변경해보며 학습을 진행하였다. 초기 데이터로 진행한 감성분석의 정확도가 약 74%가 나온 반면, 데이터 정제와 모델의 하이퍼파라미터 보정 후 정확도가 약 89%로 약 15% 증가함을 볼 수 있다. 그 후 감성분석 성능이 가장 높은 모델을 사용하여 리뷰를 선택해 참고할 수 있게 하고자 애플리케이션을 개발하였다. 해당 애플리케이션을 사용함으로써 개발자가 사용자의 만족도를 높이는 방향으로 업그레이드하도록 도움을 줄 것이라 기대한다. User reviews and ratings available on application distribution platforms have a significant impact on the number of downloads an application receives, so developers rely on reviews to get feedback from users and update their applications. However, it is inconvenient to read all the reviews to know what users want. To improve this, we want to analyze the review dataset and show the results to developers. After cleaning the dataset, we proceeded to fine-tune the model by changing the hyperparameters. We created an initial dataset by crawling KakaoTalk and Instagram reviews, and conducted sentiment analysis using KoBERT, KoGPT-2, and KoBART models. We retrained each model with the purified dataset and changed the hyperparameters of the models to improve the learning. While the accuracy of sentiment analysis with the initial data was about 74%, we can see that the accuracy increased by about 15% to about 89% after data purification and model hyperparameter correction. We then developed an application to select and reference reviews using the model with the highest sentiment analysis performance. By using this application, we hope to help developers upgrade to improve user satisfaction. KCI Citation Count: 0
Author 박연지(Yeon-Ji Park)
나준영(Jun-Yeong Na)
이민아(Min-A Lee)
손채봉(Chae-Bong Sohn)
Author_xml – sequence: 1
  fullname: 이민아(Min-A Lee)
– sequence: 2
  fullname: 박연지(Yeon-Ji Park)
– sequence: 3
  fullname: 나준영(Jun-Yeong Na)
– sequence: 4
  fullname: 손채봉(Chae-Bong Sohn)
BackLink https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART003019099$$DAccess content in National Research Foundation of Korea (NRF)
BookMark eNotj8tKw0AYhQdRsGqfwM1s3IiJmX8myWTZar2gqEgW7sI0FwlqIy0uXAgKcSFUdGGlSgtuVISCFbwt-kRm5h2Ml9V34Bw-OGNouJbUQoQmiaE7NvDZwG_oYADVgemE6MApGUIFAG5rNuVbw6hATIdrYBjOKCo2GnHVMCm1bQAooKOVpFzZdGfwSrK44WrwE8qlTRerm468fcJZ_wKrVlt2X9X5QDWbWXeQPX-qtI_lW0fenaibq-x-gOVjqq7PVKuDs4de9tHHX_1Lmb5k76lMu1i27tRVM2_k4Dg3ydM2_nrrqXY6gUYisdsIi_8cR-5CxZ1b0lbXF5fnSqtazTKpxk1GIp8xzoRlCp8JQoFASGzbt0UkwqDq-36V0iphnFhBBEKwkHPmcGaEgUPpOJr-09bqkbfjx14i4l9uJ95O3cvvLnvEoMDBYvl46n98UI_3wiAW3n4eRP3QW1ufrxBiEYsxSr8B96qQCg
ContentType Journal Article
DBID DBRKI
TDB
ACYCR
DOI 10.9728/dcs.2023.24.11.2831
DatabaseName DBPIA - 디비피아
DBpia Journals
Korean Citation Index
DatabaseTitleList
DeliveryMethod fulltext_linktorsrc
DocumentTitleAlternate Implementation of Review Sentiment Analysis Application Using KoBERT, KoGPT-2, and KoBART Optimized Hyperparameters
DocumentTitle_FL Implementation of Review Sentiment Analysis Application Using KoBERT, KoGPT-2, and KoBART Optimized Hyperparameters
EISSN 2287-738X
EndPage 2840
ExternalDocumentID oai_kci_go_kr_ARTI_10328264
NODE11616443
GroupedDBID ALMA_UNASSIGNED_HOLDINGS
DBRKI
M~E
TDB
ACYCR
ID FETCH-LOGICAL-n653-8541fc4484a65ac4a13212e177c7afaedbcccb33b14816df2aa4e8849840ed933
ISSN 1598-2009
IngestDate Wed Apr 23 03:11:53 EDT 2025
Thu Feb 06 13:26:37 EST 2025
IsPeerReviewed true
IsScholarly true
Issue 11
Keywords 감정분석
KoBART
자연어처리
KoGPT-2
Natural Language Processing
Sentiment Analysis
KoBERT
Language Korean
LinkModel OpenURL
MergedId FETCHMERGED-LOGICAL-n653-8541fc4484a65ac4a13212e177c7afaedbcccb33b14816df2aa4e8849840ed933
PageCount 10
ParticipantIDs nrf_kci_oai_kci_go_kr_ARTI_10328264
nurimedia_primary_NODE11616443
PublicationCentury 2000
PublicationDate 2023-11
PublicationDateYYYYMMDD 2023-11-01
PublicationDate_xml – month: 11
  year: 2023
  text: 2023-11
PublicationDecade 2020
PublicationTitle 디지털콘텐츠학회논문지
PublicationYear 2023
Publisher 한국디지털콘텐츠학회
Publisher_xml – name: 한국디지털콘텐츠학회
SSID ssib053377222
ssib008451574
ssib049971524
ssib036278589
ssib053682487
Score 2.2336755
Snippet 응용 프로그램 배포 플랫폼에서 제공되는 사용자 리뷰와 별점은 애플리케이션의 다운로드 횟수에 큰 영향을 미치기 때문에, 개발자들은 리뷰를 통해 사용자들의 피드백을 받아들이고 애플리케이션을 업데이트한다. 그러나 사용자가 원하는 것을 알기 위해서는 리뷰를 모두 읽어야만 하는 불편함이 있다....
SourceID nrf
nurimedia
SourceType Open Website
Publisher
StartPage 2831
SubjectTerms 컴퓨터학
Title KoBERT, KoGPT-2, KoBART 활용 및 하이퍼파라미터 최적화를 진행한 리뷰 감성분석 애플리케이션 구현
URI https://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11616443
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART003019099
Volume 24
hasFullText 1
inHoldings 1
isFullTextHit
isPrint
ispartofPNX 디지털콘텐츠학회논문지, 2023, 24(11), , pp.2831-2840
link http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrR1Na9RANNR60IsoKtaPEtCc1tRNMpPMHJPs1lppLbpCPS1JdtKWQraU7kVQFNaDUNFDK6200IuKUHAFqx72F3WT_-CbyWR3KwU_EJbs5M28N-8jM_NeyLxRlBt2EAbIaTR0wsqBjoww1gNMmR4bjIE7zxPw8Rf6M7P21EM0PY_nR0ZXhr5aaq2FE9HjY_eV_ItVAQZ25btk_8KyfaIAgDLYF65gYbj-kY3vNr3q_ZoYq83bczXdzIseOKklrVrRKNWor1V9jbqaC9F_1dO8skYm80qsUSIqK5qHOIRAwRcFn_-gNc0hnuZOah4RVQhIlDiahyVxF0gaRXdItMaAJhq5DsfgdbZGaNGtL1hxbc0VxD0np-ly7miZ4_FuDFFnCwICQiuCJlCALjkpJNmUlHzOLCkPyQS3XMqcNhaNKlzq_Ly4wikXkiLBe85xuZBU6McTKByCJXcAlxxgLjQvuJIVgguN-RJdECye6yHecqX6UiLozSQzS4nulsS3UXSAIYwGTXhDrqkBlyZ5xJqJPr1UmhOfvB9BIqa0r4sKpRBuKJNMtxKdIy7A2noECdRlFyIaQu8eZxUMZxJ_MWC6x5EeNBeTAk2-LzItuXGyGOF9Sxear_wvJQ-volQM1JwTJmAmhOa6Y4lzpPtLb759vphijOGFlEjngMnbPKnXrws-dUy-iaUR8cz7pjVhIvABJgbIRzKpz96rVA2IcCAEsE4oJ03HER92zDyt9lcggsC_HwREMFE5BA_OY0CUOuDw9ushVoLodJAAE1s2MZE4lbOvgzzVGWf01jFsgkubrIInfCpp8eM8YE0Ycm9rZ5UzMi5V3XySOaeMLDfPK0_yCeamKqcXXuCTi5pt76TvPqm9zms129xKd79mr7rZ-npvt9v7_CNrd9T0YCfde55tb_Ted9X0Yzt7-zLb3FF7H_Z73zvqYedN2v7S-9ZO27tqurmXbaxDTdp9BpTSF1vq4cF-ttW-oNQmqzV_SpfnteiJjS2dYGTEEUIEBTYOIhQYFvjFzHCcyAnigDXCKIpCywoNRAy7EZtBgBghiIJtWYNa1kVlNGkm7JKiUmzGFg4DKzIshCgKqUMZYmEcOzTGNh1TroPW6svRUp2nx-f_C8368modVHCnLnKEQqA3poz3tVpfyZP31Icfgsu_a3BFOT0YQleV0bXVFrsGQchaOC6em5_M5_UB
linkProvider ISSN International Centre
openUrl ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=KoBERT%2C+KoGPT-2%2C+KoBART+%ED%99%9C%EC%9A%A9+%EB%B0%8F+%ED%95%98%EC%9D%B4%ED%8D%BC%ED%8C%8C%EB%9D%BC%EB%AF%B8%ED%84%B0+%EC%B5%9C%EC%A0%81%ED%99%94%EB%A5%BC+%EC%A7%84%ED%96%89%ED%95%9C+%EB%A6%AC%EB%B7%B0+%EA%B0%90%EC%84%B1%EB%B6%84%EC%84%9D+%EC%95%A0%ED%94%8C%EB%A6%AC%EC%BC%80%EC%9D%B4%EC%85%98+%EA%B5%AC%ED%98%84&rft.jtitle=%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C%EB%85%BC%EB%AC%B8%EC%A7%80&rft.au=%EC%9D%B4%EB%AF%BC%EC%95%84%28Min-A+Lee%29&rft.au=%EB%B0%95%EC%97%B0%EC%A7%80%28Yeon-Ji+Park%29&rft.au=%EB%82%98%EC%A4%80%EC%98%81%28Jun-Yeong+Na%29&rft.au=%EC%86%90%EC%B1%84%EB%B4%89%28Chae-Bong+Sohn%29&rft.date=2023-11-01&rft.pub=%ED%95%9C%EA%B5%AD%EB%94%94%EC%A7%80%ED%84%B8%EC%BD%98%ED%85%90%EC%B8%A0%ED%95%99%ED%9A%8C&rft.issn=1598-2009&rft.eissn=2287-738X&rft.volume=24&rft.issue=11&rft.spage=2831&rft.epage=2840&rft_id=info:doi/10.9728%2Fdcs.2023.24.11.2831&rft.externalDocID=NODE11616443
thumbnail_l http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=1598-2009&client=summon
thumbnail_m http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=1598-2009&client=summon
thumbnail_s http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=1598-2009&client=summon