卷积块注意力模块嵌入Regnety网络的词义消歧

本发明涉及一种卷积块注意力模块(Convolutional Block Attention Module,CBAM)嵌入Regnety网络的词义消歧方法。本发明对SemEval-2007:Task#5的训练语料和测试语料进行分词、词性标注、拼音首字母标注、声调标注和语义类标注。选取歧义词左右具有名词、动词、形容词、数词、量词和代词词性的邻接词汇单元的词形、词性、语义类、拼音首字母和声调作为消歧特征。利用Word2Vec工具对消歧特征进行向量化处理,得到训练数据和测试数据;将CBAM嵌入Regnety之中,获得词义消歧模型CBAMRegnety。利用训练数据对CBAMRegnety进行训练,得到...

Full description

Saved in:
Bibliographic Details
Format Patent
LanguageChinese
Published 13.05.2025
Subjects
Online AccessGet full text

Cover

More Information
Summary:本发明涉及一种卷积块注意力模块(Convolutional Block Attention Module,CBAM)嵌入Regnety网络的词义消歧方法。本发明对SemEval-2007:Task#5的训练语料和测试语料进行分词、词性标注、拼音首字母标注、声调标注和语义类标注。选取歧义词左右具有名词、动词、形容词、数词、量词和代词词性的邻接词汇单元的词形、词性、语义类、拼音首字母和声调作为消歧特征。利用Word2Vec工具对消歧特征进行向量化处理,得到训练数据和测试数据;将CBAM嵌入Regnety之中,获得词义消歧模型CBAMRegnety。利用训练数据对CBAMRegnety进行训练,得到优化后的CBAMRegnety。在优化后的CBAMRegnety上,对测试数据进行消歧,得到歧义词汇在每个语义类别下的权重。权重最大的语义类别即为歧义词汇的语义类别。本发明对歧义词汇实现了很好的消歧,更准确地判断歧义词汇的真实含义。 The invention relates to a word sense disambiguation method for embedding a convolutional block attention module (CBAM) into a Regnet network, in particular to a word sense disambiguation method for embedding the CBAM into the Regnet network. According to the method, word segmentation, part-of-speech tagging, pinyin initial tagging, tone tagging and semantic tagging are carried out on a training corpus and a test corpus of SemEval-2007: Task # 5. Selecting word forms, part-of-speech, semantic classes, pinyin initials and tones of adjacent vocabulary units with part-of-speech of nouns, verbs, adjectiv
Bibliography:Application Number: CN202210720884