基于多粒度对抗训练的鲁棒跨语言对话系统
跨语言对话系统是当前国际研究的热点和难点.在实际的应用系统搭建中,通常需要翻译引擎作为不同语言之间对话的桥梁.然而,翻译引擎往往是基于不同训练样本构建的,无论是所在领域,还是擅长处理语言的特性,均与对话系统的实际应用需求存在较大的差异,从而导致整个对话系统的鲁棒性差、响应性能低.因此,如何增强跨语言对话系统的鲁棒性对于提升其实用性具有重要的意义.提出了一种基于多粒度对抗训练的鲁棒跨语言对话系统构建方法.该方法首先面向机器翻译构建多粒度噪声数据,分别在词汇、短语和句子层面生成相应的对抗样本,之后利用多粒度噪声数据和干净数据进行对抗训练,从而更新对话系统的参数,进而指导对话系统学习噪声无关的隐层向...
Saved in:
Published in | 自动化学报 Vol. 47; no. 8; pp. 1855 - 1866 |
---|---|
Main Authors | , , , |
Format | Journal Article |
Language | Chinese |
Published |
中国科学院自动化研究所模式识别国家重点实验室 北京100190
01.08.2021
凡语AI研究院,北京中科凡语科技有限公司 北京100080 中国科学院大学人工智能学院 北京100049%中国科学院自动化研究所模式识别国家重点实验室 北京100190 中国科学院大学人工智能学院 北京100049 |
Subjects | |
Online Access | Get full text |
ISSN | 0254-4156 |
DOI | 10.16383/j.aas.c200764 |
Cover
Summary: | 跨语言对话系统是当前国际研究的热点和难点.在实际的应用系统搭建中,通常需要翻译引擎作为不同语言之间对话的桥梁.然而,翻译引擎往往是基于不同训练样本构建的,无论是所在领域,还是擅长处理语言的特性,均与对话系统的实际应用需求存在较大的差异,从而导致整个对话系统的鲁棒性差、响应性能低.因此,如何增强跨语言对话系统的鲁棒性对于提升其实用性具有重要的意义.提出了一种基于多粒度对抗训练的鲁棒跨语言对话系统构建方法.该方法首先面向机器翻译构建多粒度噪声数据,分别在词汇、短语和句子层面生成相应的对抗样本,之后利用多粒度噪声数据和干净数据进行对抗训练,从而更新对话系统的参数,进而指导对话系统学习噪声无关的隐层向量表示,最终达到提升跨语言对话系统性能的目的 .在公开对话数据集上对两种语言的实验表明,所提出的方法能够显著提升跨语言对话系统的性能,尤其提升跨语言对话系统的鲁棒性. |
---|---|
ISSN: | 0254-4156 |
DOI: | 10.16383/j.aas.c200764 |