基于对比学习思想的多跳问题生成

TP391; 针对获取大规模的多跳问答训练数据集耗时耗力的问题,提出一个基于对比学习思想的多跳问题生成模型.模型分为生成阶段和对比学习打分阶段,生成阶段通过执行推理图生成候选多跳问题,对比学习打分阶段通过一个基于对比学习思想的无参考问题的候选问题打分模型对候选问题进行打分排序,并选择最优的候选问题.该模型在一定程度上缩小了无监督方法与人工标注方法的差距,有效缓解了缺少多跳问答数据集的问题.在数据集HotpotQA上的实验结果表明,基于对比学习的多跳问题生成模型能有效扩充训练数据,极大减少了人工标注数据的成本....

Full description

Saved in:
Bibliographic Details
Published in吉林大学学报(理学版) Vol. 61; no. 5; pp. 1103 - 1111
Main Authors 王红斌, 杨何祯旻, 王灿宇
Format Journal Article
LanguageChinese
Published 昆明理工大学信息工程与自动化学院,昆明650500 2023
昆明理工大学云南省人工智能重点实验室,昆明650500
昆明理工大学云南省计算机技术应用重点实验室,昆明650500%云南农业大学大数据学院,昆明650201
Subjects
Online AccessGet full text
ISSN1671-5489
DOI10.13413/j.cnki.jdxblxb.2022422

Cover

More Information
Summary:TP391; 针对获取大规模的多跳问答训练数据集耗时耗力的问题,提出一个基于对比学习思想的多跳问题生成模型.模型分为生成阶段和对比学习打分阶段,生成阶段通过执行推理图生成候选多跳问题,对比学习打分阶段通过一个基于对比学习思想的无参考问题的候选问题打分模型对候选问题进行打分排序,并选择最优的候选问题.该模型在一定程度上缩小了无监督方法与人工标注方法的差距,有效缓解了缺少多跳问答数据集的问题.在数据集HotpotQA上的实验结果表明,基于对比学习的多跳问题生成模型能有效扩充训练数据,极大减少了人工标注数据的成本.
ISSN:1671-5489
DOI:10.13413/j.cnki.jdxblxb.2022422