Prioritized Text Detergent: Comparing Two Judgment Scales of Analytic Hierarchy Process on Prioritizing Pre-Processing Techniques on Social Media Sentiment Analysis
تستخدم معظم الشركات بيانات وسائل التواصل الاجتماعي للأعمال. يقوم تحليل المشاعر تلقائيًا بجمع التحليلات وتلخيص هذا النوع من البيانات. من الصعب إدارة بيانات وسائل التواصل الاجتماعي غير المنظمة. حيث تمثل البيانات المزعجة او غير متناسقة تحديًا لتحليل المشاعر. نظرًا لأن أكثر من 50٪ من عملية تحليل المشاعر...
Saved in:
Published in | Majallat Baghdād lil-ʻulūm Vol. 21; no. 2(SI); p. 662 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | English Arabic |
Published |
College of Science for Women, University of Baghdad
01.01.2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Abstract | تستخدم معظم الشركات بيانات وسائل التواصل الاجتماعي للأعمال. يقوم تحليل المشاعر تلقائيًا بجمع التحليلات وتلخيص هذا النوع من البيانات. من الصعب إدارة بيانات وسائل التواصل الاجتماعي غير المنظمة. حيث تمثل البيانات المزعجة او غير متناسقة تحديًا لتحليل المشاعر. نظرًا لأن أكثر من 50٪ من عملية تحليل المشاعر هي معالجة مسبقة للبيانات، فإن معالجة بيانات الوسائط الاجتماعية الضخمة تمثل تحديًا أيضًا. إذا تم إجراء المعالجة المسبقة بشكل صحيح، فقد تتحسن دقة البيانات. أيضًا، يعتمد سير العمل في تحليل المشاعر بشكل كبير. نظرًا لعدم وجود تقنية معالجة مسبقة تعمل بشكل جيد في جميع المواقف أو مع جميع مصادر البيانات، فإن اختيار أهم المصادر أمر بالغ الأهمية. تحديد الأولويات هو أسلوب ممتاز لاختيار الأكثر أهمية.باعتبارها إحدى طرق اتخاذ القرار متعدد المعايير (MCDM)، تُفضل عملية التحليل الهرمي (AHP) التعامل مع تحديات صنع القرار المعقدة باستخدام عدة معايير. تم استخدام درجات نسبة الاتساق (CR) لفحص المقارنات الزوجية لتقييم AHP. استخدمت هذه الدراسة مقياسين للحصول على الحكم الأكثر اتساقًا. أولاً، مقياس حكم Saaty (SS)، ثم المقياس المتوازن المعمم (GBS). لقد تم التحقق فيما إذا كان هناك مقياسان مختلفان لحكم AHP سيؤثران على صنع القرار. المعايير الرئيسية لتحديد أولوية تقنيات المعالجة المسبقة في تحليل المشاعر هي علامات الترقيم والإملاء والرقم والسياق. تحتوى هذه المعايير الأربعة أيضا معايير فرعية. تكون مقارنات الزوجية GBS أقرب إلى قيمة CR من SS، مما يقلل من نسب وزن البدائل.تشرح هذه الورقة كيف يساعد AHP في اتخاذ القرار المنطقي. يمكن أن يكون تحديد أولوية تقنيات المعالجة المسبقة باستخدام AHP نموذجًا لمراحل تحليل المشاعر الأخرى. باختصار، تضيف هذه الورقة مساهمة أخرى إلى مجال تحليلات البيانات الضخمة.
Most companies use social media data for business. Sentiment analysis automatically gathers analyses and summarizes this type of data. Managing unstructured social media data is difficult. Noisy data is a challenge to sentiment analysis. Since over 50% of the sentiment analysis process is data pre-processing, processing big social media data is challenging too. If pre-processing is carried out correctly, data accuracy may improve. Also, sentiment analysis workflow is highly dependent. Because no pre-processing technique works well in all situations or with all data sources, choosing the most important ones is crucial. Prioritization is an excellent technique for choosing the most important ones. As one of many Multi-Criteria Decision Making (MCDM) methods, the Analytic Hierarchy Process (AHP) is preferred for handling complicated decision-making challenges using several criteria. The Consistency Ratio (CR) scores were used to examine pair-wise comparisons to evaluate the AHP. This study used two judgment scales to get the most consistent judgment. Firstly, the Saaty judgment scale (SS), then the Generalized Balanced Scale (GBS). It investigated whether two different AHP judgment scales would affect decision-making. The main criteria for prioritizing pre-processing techniques in sentiment analysis are Punctuation, Spelling, Number, and Context. These four criteria also contain sub-criteria. GBS pair-wise comparisons are closer to the CR value than SS, reducing the alternatives’ weight ratios. This paper explains how AHP aids logical decision-making. Prioritizing pre-processing techniques with AHP can be a paradigm for other sentiment analysis stages. In short, this paper adds another contribution to the Big Data Analytics domain. |
---|---|
AbstractList | Most companies use social media data for business. Sentiment analysis automatically gathers analyses and summarizes this type of data. Managing unstructured social media data is difficult. Noisy data is a challenge to sentiment analysis. Since over 50% of the sentiment analysis process is data pre-processing, processing big social media data is challenging too. If pre-processing is carried out correctly, data accuracy may improve. Also, sentiment analysis workflow is highly dependent. Because no pre-processing technique works well in all situations or with all data sources, choosing the most important ones is crucial. Prioritization is an excellent technique for choosing the most important ones. As one of many Multi-Criteria Decision Making (MCDM) methods, the Analytic Hierarchy Process (AHP) is preferred for handling complicated decision-making challenges using several criteria. The Consistency Ratio (CR) scores were used to examine pair-wise comparisons to evaluate the AHP. This study used two judgment scales to get the most consistent judgment. Firstly, the Saaty judgment scale (SS), then the Generalized Balanced Scale (GBS). It investigated whether two different AHP judgment scales would affect decision-making. The main criteria for prioritizing pre-processing techniques in sentiment analysis are Punctuation, Spelling, Number, and Context. These four criteria also contain sub-criteria. GBS pair-wise comparisons are closer to the CR value than SS, reducing the alternatives’ weight ratios. This paper explains how AHP aids logical decision-making. Prioritizing pre-processing techniques with AHP can be a paradigm for other sentiment analysis stages. In short, this paper adds another contribution to the Big Data Analytics domain. تستخدم معظم الشركات بيانات وسائل التواصل الاجتماعي للأعمال. يقوم تحليل المشاعر تلقائيًا بجمع التحليلات وتلخيص هذا النوع من البيانات. من الصعب إدارة بيانات وسائل التواصل الاجتماعي غير المنظمة. حيث تمثل البيانات المزعجة او غير متناسقة تحديًا لتحليل المشاعر. نظرًا لأن أكثر من 50٪ من عملية تحليل المشاعر هي معالجة مسبقة للبيانات، فإن معالجة بيانات الوسائط الاجتماعية الضخمة تمثل تحديًا أيضًا. إذا تم إجراء المعالجة المسبقة بشكل صحيح، فقد تتحسن دقة البيانات. أيضًا، يعتمد سير العمل في تحليل المشاعر بشكل كبير. نظرًا لعدم وجود تقنية معالجة مسبقة تعمل بشكل جيد في جميع المواقف أو مع جميع مصادر البيانات، فإن اختيار أهم المصادر أمر بالغ الأهمية. تحديد الأولويات هو أسلوب ممتاز لاختيار الأكثر أهمية.باعتبارها إحدى طرق اتخاذ القرار متعدد المعايير (MCDM)، تُفضل عملية التحليل الهرمي (AHP) التعامل مع تحديات صنع القرار المعقدة باستخدام عدة معايير. تم استخدام درجات نسبة الاتساق (CR) لفحص المقارنات الزوجية لتقييم AHP. استخدمت هذه الدراسة مقياسين للحصول على الحكم الأكثر اتساقًا. أولاً، مقياس حكم Saaty (SS)، ثم المقياس المتوازن المعمم (GBS). لقد تم التحقق فيما إذا كان هناك مقياسان مختلفان لحكم AHP سيؤثران على صنع القرار. المعايير الرئيسية لتحديد أولوية تقنيات المعالجة المسبقة في تحليل المشاعر هي علامات الترقيم والإملاء والرقم والسياق. تحتوى هذه المعايير الأربعة أيضا معايير فرعية. تكون مقارنات الزوجية GBS أقرب إلى قيمة CR من SS، مما يقلل من نسب وزن البدائل.تشرح هذه الورقة كيف يساعد AHP في اتخاذ القرار المنطقي. يمكن أن يكون تحديد أولوية تقنيات المعالجة المسبقة باستخدام AHP نموذجًا لمراحل تحليل المشاعر الأخرى. باختصار، تضيف هذه الورقة مساهمة أخرى إلى مجال تحليلات البيانات الضخمة. Most companies use social media data for business. Sentiment analysis automatically gathers analyses and summarizes this type of data. Managing unstructured social media data is difficult. Noisy data is a challenge to sentiment analysis. Since over 50% of the sentiment analysis process is data pre-processing, processing big social media data is challenging too. If pre-processing is carried out correctly, data accuracy may improve. Also, sentiment analysis workflow is highly dependent. Because no pre-processing technique works well in all situations or with all data sources, choosing the most important ones is crucial. Prioritization is an excellent technique for choosing the most important ones. As one of many Multi-Criteria Decision Making (MCDM) methods, the Analytic Hierarchy Process (AHP) is preferred for handling complicated decision-making challenges using several criteria. The Consistency Ratio (CR) scores were used to examine pair-wise comparisons to evaluate the AHP. This study used two judgment scales to get the most consistent judgment. Firstly, the Saaty judgment scale (SS), then the Generalized Balanced Scale (GBS). It investigated whether two different AHP judgment scales would affect decision-making. The main criteria for prioritizing pre-processing techniques in sentiment analysis are Punctuation, Spelling, Number, and Context. These four criteria also contain sub-criteria. GBS pair-wise comparisons are closer to the CR value than SS, reducing the alternatives’ weight ratios. This paper explains how AHP aids logical decision-making. Prioritizing pre-processing techniques with AHP can be a paradigm for other sentiment analysis stages. In short, this paper adds another contribution to the Big Data Analytics domain. |
Author | Zaki, Ummu Hani’ Hair Ibrahim, Roliana Abd Halim, Shahliza Kamsani, Izyan Izzati |
Author_xml | – sequence: 1 givenname: Ummu Hani’ Hair orcidid: 0000-0002-3747-8505 surname: Zaki fullname: Zaki, Ummu Hani’ Hair – sequence: 2 givenname: Roliana orcidid: 0000-0001-7580-1804 surname: Ibrahim fullname: Ibrahim, Roliana – sequence: 3 givenname: Shahliza orcidid: 0000-0002-5533-2171 surname: Abd Halim fullname: Abd Halim, Shahliza – sequence: 4 givenname: Izyan Izzati orcidid: 0000-0001-7788-5407 surname: Kamsani fullname: Kamsani, Izyan Izzati |
BookMark | eNo9kc1OwzAQhC0EEqVw5ewXSLGdOIm5ofLTIhCVWs7Wxt4UozQGOwjK8_CgpCnitKud1TcazQk5bH2LhJxzNhGci_Siiq8TwUQ2UYVkB2QkMs6TQpX5Yb-zokzKPJfH5CxGVzGeccWFyEfkZxGcD65z32jpCr86eo0dhjW23SWd-s0bBNeu6erT0_sPu970d7o00GCkvqZXLTTbzhk6cxggmJctXQRvMPZqS__RO8IiYPKnDUA0L617_8Dhc-mNg4Y-onVAl72HG4wGfHTxlBzV0EQ8-5tj8nx7s5rOkoenu_n06iExQvZpgVclkxY4K1LkBWTCqgqQc2tyLsGCwUoUUuSysnVlK6nKguWpZGmGUqQ2HZP5nms9vOq34DYQttqD08PBh7WG0MdtUNfIJQpTWmmKLGVSCaZqwaQxVmKmVM-a7Fkm-BgD1v88zvRQme4r07vK9K6y9Bci2I7X |
ContentType | Journal Article |
DBID | AAYXX CITATION DOA |
DOI | 10.21123/bsj.2024.9750 |
DatabaseName | CrossRef Open Access: DOAJ - Directory of Open Access Journals |
DatabaseTitle | CrossRef |
DatabaseTitleList | CrossRef |
Database_xml | – sequence: 1 dbid: DOA name: DOAJ Directory of Open Access Journals url: https://www.doaj.org/ sourceTypes: Open Website |
DeliveryMethod | fulltext_linktorsrc |
EISSN | 2411-7986 |
ExternalDocumentID | oai_doaj_org_article_fe15e2c8d5c743059209f205ccd5e499 10_21123_bsj_2024_9750 |
GroupedDBID | AAYXX ADBBV AFWDF ALMA_UNASSIGNED_HOLDINGS ARCSS BCNDV CITATION GROUPED_DOAJ M~E RIG |
ID | FETCH-LOGICAL-c2511-a1b805da1073e17a42d9bae11dc615adaceb275265bdfbdb59870635034e523d3 |
IEDL.DBID | DOA |
ISSN | 2078-8665 |
IngestDate | Thu Jul 04 20:43:54 EDT 2024 Fri Aug 23 03:10:58 EDT 2024 |
IsDoiOpenAccess | true |
IsOpenAccess | true |
IsPeerReviewed | false |
IsScholarly | false |
Issue | 2(SI) |
Language | English Arabic |
LinkModel | DirectLink |
MergedId | FETCHMERGED-LOGICAL-c2511-a1b805da1073e17a42d9bae11dc615adaceb275265bdfbdb59870635034e523d3 |
ORCID | 0000-0001-7580-1804 0000-0001-7788-5407 0000-0002-5533-2171 0000-0002-3747-8505 |
OpenAccessLink | https://doaj.org/article/fe15e2c8d5c743059209f205ccd5e499 |
ParticipantIDs | doaj_primary_oai_doaj_org_article_fe15e2c8d5c743059209f205ccd5e499 crossref_primary_10_21123_bsj_2024_9750 |
PublicationCentury | 2000 |
PublicationDate | 2024-01-01 |
PublicationDateYYYYMMDD | 2024-01-01 |
PublicationDate_xml | – month: 01 year: 2024 text: 2024-01-01 day: 01 |
PublicationDecade | 2020 |
PublicationTitle | Majallat Baghdād lil-ʻulūm |
PublicationYear | 2024 |
Publisher | College of Science for Women, University of Baghdad |
Publisher_xml | – name: College of Science for Women, University of Baghdad |
SSID | ssib014191226 ssj0002013441 ssib026597068 ssib044752010 ssib012089588 |
Score | 1.9112302 |
Snippet | تستخدم معظم الشركات بيانات وسائل التواصل الاجتماعي للأعمال. يقوم تحليل المشاعر تلقائيًا بجمع التحليلات وتلخيص هذا النوع من البيانات. من الصعب إدارة بيانات... Most companies use social media data for business. Sentiment analysis automatically gathers analyses and summarizes this type of data. Managing unstructured... |
SourceID | doaj crossref |
SourceType | Open Website Aggregation Database |
StartPage | 662 |
SubjectTerms | Analytical Hierarchy Process, Data Pre-processing, Multi-Criteria Decision-Making, Pre-processing Technique, Prioritization, Sentiment Analysis, Social Media |
Title | Prioritized Text Detergent: Comparing Two Judgment Scales of Analytic Hierarchy Process on Prioritizing Pre-Processing Techniques on Social Media Sentiment Analysis |
URI | https://doaj.org/article/fe15e2c8d5c743059209f205ccd5e499 |
Volume | 21 |
hasFullText | 1 |
inHoldings | 1 |
isFullTextHit | |
isPrint | |
link | http://utb.summon.serialssolutions.com/2.0.0/link/0/eLvHCXMwrV09T8MwELVQJxYEAkT5kgckptDYiZOYDQpVVQlUqa3ULYo_UsrQoLQVgt_DD-XOSdtsLIxJrHPiu9jv2b5nQm50oiOdRMBOLI-8MGfCkzKEH08Z5A9xHEWYO_zyGvUn4WAqpo2jvnBPWCUPXDVcJ7dMWK4TI3SM8lSS-zLnvtDaCAtw3fW-TDTIFEQS434ixU6Ii4VASxpAg0eAo_0d0EbVO1wW3s7OwEUQumMvOYyhHorCVYqPUBcPOmr5DtSSh3cyxoT9xojWEP53I1TvkBzU0JI-VJ90RPay8pj8DMt5gcJF39bQMfTE9Ak3wGBC1T3tVocQLmZ0_FnQwdrMcK6QjsBvdkmLnDrJEjBH-3NMVNZvX7TOLKDFgm5No4Vhab36mTO40YZ1JaskYIqrQhkd4QYlV9FGEeWETHrP427fq09m8DRSEi9jKvGFyYA7BpbFWciNVJllzGhASJnJNBD2GJX3lcmVUULicmog_CC0wHxNcEpai2JhzwjVSua-0QZglAWq6EsFBlVgrIpsAnbb5HbTuulHJcCRAnFxfkjBDyn6IUU_tMkjNv62FApnuxsQTmkdTulf4XT-H0YuyD6-VTVTc0laq3JtrwC7rNS1C9NffB_mVg |
link.rule.ids | 315,786,790,870,2115,27955,27956 |
linkProvider | Directory of Open Access Journals |
openUrl | ctx_ver=Z39.88-2004&ctx_enc=info%3Aofi%2Fenc%3AUTF-8&rfr_id=info%3Asid%2Fsummon.serialssolutions.com&rft_val_fmt=info%3Aofi%2Ffmt%3Akev%3Amtx%3Ajournal&rft.genre=article&rft.atitle=Prioritized+Text+Detergent%3A+Comparing+Two+Judgment+Scales+of+Analytic+Hierarchy+Process+on+Prioritizing+Pre-Processing+Techniques+on+Social+Media+Sentiment+Analysis&rft.jtitle=Majallat+Baghd%C4%81d+lil-%CA%BBul%C5%ABm&rft.au=Zaki%2C+Ummu+Hani%E2%80%99+Hair&rft.au=Ibrahim%2C+Roliana&rft.au=Abd+Halim%2C+Shahliza&rft.au=Kamsani%2C+Izyan+Izzati&rft.date=2024-01-01&rft.issn=2078-8665&rft.eissn=2411-7986&rft.volume=21&rft.issue=2%28SI%29&rft.spage=662&rft_id=info:doi/10.21123%2Fbsj.2024.9750&rft.externalDBID=n%2Fa&rft.externalDocID=10_21123_bsj_2024_9750 |
thumbnail_l | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/lc.gif&issn=2078-8665&client=summon |
thumbnail_m | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/mc.gif&issn=2078-8665&client=summon |
thumbnail_s | http://covers-cdn.summon.serialssolutions.com/index.aspx?isbn=/sc.gif&issn=2078-8665&client=summon |