基于集成一致性的多源跨领域情感分类模型

TP274; 现有的跨领域情感分类方法大多只利用了单个源域到目标域的迁移特征,没有充分考虑目标域实例与不同源域之间的联系.针对此问题,本文提出一种无监督的多源跨领域情感分类模型.首先利用单个源域到目标域的迁移特征训练基分类器,并对不同的基分类器加权;然后将不同基分类器对目标域实例预测的集成一致性作为目标函数,优化该目标函数,得到不同基分类器的权重;最后利用加权后的基分类器得到目标域的情感分类结果.该模型在亚马逊产品评论数据集上和Skytrax数据集上进行了实验,并与6种基线模型进行了比较.实验结果表明,本文方法相比基线模型,在8个不同目标域的实验中分类性能均有明显提升....

Full description

Saved in:
Bibliographic Details
Published in数据采集与处理 Vol. 35; no. 5; pp. 858 - 866
Main Authors 梁俊葛, 线岩团, 相艳, 王红斌, 陆婷, 许莹
Format Journal Article
LanguageChinese
Published 昆明理工大学信息工程与自动化学院,昆明,650500%昆明理工大学信息工程与自动化学院,昆明,650500 01.09.2020
昆明理工大学云南省人工智能重点实验室,昆明, 650500
Subjects
Online AccessGet full text
ISSN1004-9037
DOI10.16337/j.1004-9037.2020.05.007

Cover

More Information
Summary:TP274; 现有的跨领域情感分类方法大多只利用了单个源域到目标域的迁移特征,没有充分考虑目标域实例与不同源域之间的联系.针对此问题,本文提出一种无监督的多源跨领域情感分类模型.首先利用单个源域到目标域的迁移特征训练基分类器,并对不同的基分类器加权;然后将不同基分类器对目标域实例预测的集成一致性作为目标函数,优化该目标函数,得到不同基分类器的权重;最后利用加权后的基分类器得到目标域的情感分类结果.该模型在亚马逊产品评论数据集上和Skytrax数据集上进行了实验,并与6种基线模型进行了比较.实验结果表明,本文方法相比基线模型,在8个不同目标域的实验中分类性能均有明显提升.
ISSN:1004-9037
DOI:10.16337/j.1004-9037.2020.05.007