FSAGN:一种自主选择关键帧的表情识别方法

TP391.41; 由于在包含表情的视频数据集中存在大量与表情特征无关的视频帧,使得模型在训练中学习到大量无关信息,导致识别率大幅下降,因此如何令模型自主地选择视频关键帧成为研究的关键.在已有的视频表情识别方法中,大多没有考虑关键帧和非关键帧对模型训练效果的影响,为此提出了一种基于注意力机制与GhostNet的人脸表情识别(FSAGN)模型.通过自注意力机制与帧选择损失计算不同帧的权重,根据权重自主选择视频序列的关键帧.此外,为减少模型参数、降低模型的训练成本,将传统的特征提取网络替换为训练参数较少的GhostNet网络,并与注意力机制结合,分别在CK+和AFEW数据集中进行了实验,得到的最高...

Full description

Saved in:
Bibliographic Details
Published in浙江大学学报(理学版) Vol. 49; no. 2; pp. 141 - 158
Main Authors 祝锦泰, 叶继华, 郭凤, 江蕗, 江爱文
Format Journal Article
LanguageChinese
Published 江西师范大学 计算机信息工程学院,江西 南昌 330022 25.03.2022
淄博技师学院 信息工程系,山东 淄博 255030%江西师范大学 计算机信息工程学院,江西 南昌 330022
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:TP391.41; 由于在包含表情的视频数据集中存在大量与表情特征无关的视频帧,使得模型在训练中学习到大量无关信息,导致识别率大幅下降,因此如何令模型自主地选择视频关键帧成为研究的关键.在已有的视频表情识别方法中,大多没有考虑关键帧和非关键帧对模型训练效果的影响,为此提出了一种基于注意力机制与GhostNet的人脸表情识别(FSAGN)模型.通过自注意力机制与帧选择损失计算不同帧的权重,根据权重自主选择视频序列的关键帧.此外,为减少模型参数、降低模型的训练成本,将传统的特征提取网络替换为训练参数较少的GhostNet网络,并与注意力机制结合,分别在CK+和AFEW数据集中进行了实验,得到的最高识别率分别为99.64%和52.31%,分类正确率具有竞争力,适用于对视频序列较长且在视频序列中表情特征分布不均匀的面部表情识别.
ISSN:1008-9497
DOI:10.3785/j.issn.1008-9497.2022.02.002