METHOD AND DEVICE FOR TRAINING MACHINE TRANSLATION MODEL ELECTRONIC EQUIPMENT AND STORAGE MEDIUM

The present application discloses a method, a device, and an electronic device for training a machine translating model, and a recording medium and relates to the technical field of natural language processing. According to an embodiment, the detailed method is as follows: forming a first training s...

Full description

Saved in:
Bibliographic Details
Main Authors LI ZHI, ZHANG CHUANQIANG, ZHANG RUIQING, LIU JIQIANG, WU HUA, HE ZHONGJUN
Format Patent
LanguageEnglish
Korean
Published 24.12.2021
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:The present application discloses a method, a device, and an electronic device for training a machine translating model, and a recording medium and relates to the technical field of natural language processing. According to an embodiment, the detailed method is as follows: forming a first training sample set by selecting, from a parallel corpus, a sample set having translation quality satisfying a preset requirement and having a general-field feature and/or a target field feature; forming a second training sample set by selecting, from the parallel corpus, a sample set having translation quality satisfying a preset requirement and not having a general field feature and a target field feature; and sequentially training an encoder of a machine translation model in a target field, a discriminator disposed in each coating layer of the encoder, and the encoder and a decoder of the machine translation model in the target field by separately using the first training sample set and the second training sample set. The training method of the present application may save time, require less effort, and effectively improve the training efficiency of the machine learning model in the target field. 본 출원은 기계 번역 모델의 훈련 방법, 장치, 전자기기 및 기록매체를 개시하였으며 자연어 처리 기술 분야에 관한 것이다. 구체적인 구현 방법은 다음과 같다: 병렬 코퍼스에서 번역 품질이 미리 설정된 요구에 만족되고 일반 분야 특징 및/또는 목표 분야 특징을 구비하는 샘플 세트를 선택하여 제1 훈련 샘플 세트를 구성하고; 병렬 코퍼스에서 번역 품질이 미리 설정된 요구에 만족되고 일반 분야 특징과 목표 분야 특징을 구비하지 않는 샘플 세트를 선택하여 제2 훈련 샘플 세트를 구성하며; 제1 훈련 샘플 세트와 제2 훈련 샘플 세트를 별도로 사용하여 목표 분야의 기계 번역 모델의 인코더와 인코더의 각각의 코딩층에 배치된 판별기, 목표 분야의 기계 번역 모델의 인코더와 디코더를 차례로 훈련시킨다. 본 출원의 훈련 방법은 시간이 절약되고 힘이 적게 들며 목표 분야의 기계 번역 모델의 훈련 효율을 효과적으로 향상시킬 수 있다.
Bibliography:Application Number: KR20210075722