基于领域知识微调的缺陷报告严重性预测
TP311; 有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要.现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的问题.对此,提出一种基于领域知识微调的缺陷报告严重性预测方法.利用能充分考虑文本上下文语义的BERT预训练模型,并使用缺陷报告数据对其进行模型微调使其学习到相关的领域知识.微调后的BERT模型用于抽取缺陷报告的语义特征,随后使用支持向量机进行严重性预测模型的构建.在 Mozilla,Eclipse和Apache选取的共计15个项目上进行的实验表明,在准确率、召回率和...
Saved in:
Published in | 计算机科学 Vol. 51; no. z1; pp. 835 - 841 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
南京航空航天大学计算机科学与技术学院 南京 211106
2024
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | TP311; 有效预测缺陷报告的严重性,对快速、准确分派缺陷报告,帮助开发人员及时发现并处理软件中的缺陷至关重要.现有主流的基于传统信息检索或通用预训练模型的缺陷报告严重性预测方法,存在忽略上下文语义或缺陷报告特性导致预测效果受限的问题.对此,提出一种基于领域知识微调的缺陷报告严重性预测方法.利用能充分考虑文本上下文语义的BERT预训练模型,并使用缺陷报告数据对其进行模型微调使其学习到相关的领域知识.微调后的BERT模型用于抽取缺陷报告的语义特征,随后使用支持向量机进行严重性预测模型的构建.在 Mozilla,Eclipse和Apache选取的共计15个项目上进行的实验表明,在准确率、召回率和F1值上,相较传统的信息检索方法,所提方法分别能提升4.5%~22.0%,3.0%~22.0%,4.0%~22.0%;相较通用BERT模型,微调后的BERT模型的准确率、召回率和F1值分别能够提高2.0%~5.1%,1.9%~5.1%,1.8%~5.0%. |
---|---|
ISSN: | 1002-137X |
DOI: | 10.11896/jsjkx.230400068 |