ツイートデータを使用した感情推定モデルの開発の試み
【目的】本研究は,「働き方改革」を含むツイートから感情を推定するモデルの開発である.【方法】ツイート本文より,感情スコアを抽出するためのシステムの開発環境はMS-Excelとし,開発言語はVBA(Visual Basic for Applications)とした.データはTwitter社API v2(Application Programming Interface v2)を用いて計11,272ツイートを収集し,リツイート等を削除した結果,8,570件のツイートを分析対象とした.これをトレーニングデータとテストデータに分割し感情分析を行った.また,感情分析で得られた感情スコアと感情ラベル,ツイ...
Saved in:
Published in | 日本産業保健理学療法学雑誌 Vol. 2; no. 1; pp. 10 - 17 |
---|---|
Main Author | |
Format | Journal Article |
Language | Japanese |
Published |
日本産業理学療法研究会
09.05.2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | 【目的】本研究は,「働き方改革」を含むツイートから感情を推定するモデルの開発である.【方法】ツイート本文より,感情スコアを抽出するためのシステムの開発環境はMS-Excelとし,開発言語はVBA(Visual Basic for Applications)とした.データはTwitter社API v2(Application Programming Interface v2)を用いて計11,272ツイートを収集し,リツイート等を削除した結果,8,570件のツイートを分析対象とした.これをトレーニングデータとテストデータに分割し感情分析を行った.また,感情分析で得られた感情スコアと感情ラベル,ツイート本文をSVM(Support vector machine)で学習させ,テストデータを層化-5分割交差検証法にて性能評価を行った.【結果】トレーニングデータとテストデータの感情を分析した結果,それぞれネガティブが2,896件と2,824件であり,ポジティブが1,389件と1,461件であった.また,これを用いた感情推定モデルの性能評価の結果は,AUC(Area under the curve)0.936であった.【結論】本研究では,感情スコアを抽出するシステムをExcelにて構築し,働き方改革とともに発言されている語の感情を分析するモデルを開発した.その結果,テストデータの検証からAUC0.936という高い分類性能を有する感情推定モデルが開発された. |
---|---|
ISSN: | 2758-4798 |
DOI: | 10.60295/jjpoh.2.1_10 |