WORD ALIGNMENT MODEL CONSTRUCTION APPARATUS, MACHINE TRANSLATION APPARATUS, WORD ALIGNMENT MODEL PRODUCTION METHOD, AND RECORDING MEDIUM

[Problem] It has hitherto been impossible to accurately perform word alignment of a small-size parallel text corpus. [Solution] This word alignment model construction apparatus is provided with: a probability information calculation unit that, for each word pair included in a parallel text sentence...

Full description

Saved in:
Bibliographic Details
Main Author UCHIYAMA, Masao
Format Patent
LanguageEnglish
French
Japanese
Published 09.03.2017
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:[Problem] It has hitherto been impossible to accurately perform word alignment of a small-size parallel text corpus. [Solution] This word alignment model construction apparatus is provided with: a probability information calculation unit that, for each word pair included in a parallel text sentence included in small-size parallel text data, repeats a loop twice or more for one word pair to calculate first correspondence probability information that forms a pair with the one word pair, by using an initial value or the first correspondence probability information calculated in a previous loop, second correspondence probability information that forms a pair with one word pair included in a large-size word alignment model, and parallel text sentence word position probability information corresponding to one word pair in a parallel text sentence; and a correspondence probability information accumulation unit that accumulates, in association with each word pair, the first correspondence probability information calculated finally by the probability information calculation unit, in a small-size word alignment model storage unit. Thus, word alignment of the small-size parallel text corpus can be accurately performed. L'invention a pour objectif de résoudre le problème lié à l'impossibilité de réaliser actuellement avec précision un alignement de mots d'un corpus de textes parallèles de petite taille. Pour ce faire, cet appareil de construction de modèle d'alignement de mots comprend : une unité de calcul d'informations de probabilité qui, pour chaque paire de mots incluse dans une phrase de texte parallèle incluse dans des données de texte parallèles de petite taille, répète une boucle au moins deux fois pour une paire de mots afin de calculer des premières informations de probabilité de correspondance qui forment une paire avec ladite paire de mots en utilisant une valeur initiale ou les premières informations de probabilité de correspondance calculées dans une boucle précédente, des secondes informations de probabilité de correspondance qui forment une paire avec une paire de mots incluse dans un modèle d'alignement de mots de grande taille, et des informations de probabilité de position de mots de phrases de texte parallèles correspondant à une paire de mots dans une phrase de texte parallèle ; et une unité d'accumulation d'informations de probabilité de correspondance qui cumule, en association avec chaque paire de mots, les premières informations de probabilité de correspondance calculées finalement par l'unité de calcul d'informations de probabilité dans une unité de stockage de modèle d'alignement de mots de petite taille. Ainsi, l'alignement des mots du corpus de textes parallèles de petite taille peut être effectué de manière précise. 【課題】従来、小規模対訳コーパスの単語アライメントを精度よく実行できなかった。 【解決手段】小規模対訳データに含まれる対訳文が有する単語対ごとに、一の単語対に対して、初期値または前回のループにおいて算出した第一対応確率情報と、大規模単語アライメントモデルが有する一の単語対と対になる第二対応確率情報と、対訳文の中における一の単語対に対応する対訳文単語位置確率情報とを用いて、2回以上ループを繰り返して、一の単語対と対になる第一対応確率情報を算出する確率情報算出部と、単語対ごとに、確率情報算出部が最終的に算出した第一対応確率情報を、単語対に対応付けて、小規模単語アライメントモデル格納部に蓄積する対応確率情報蓄積部とを具備する単語アライメントモデル構築装置により、小規模対訳コーパスの単語アライメントを精度よく実行できる。
Bibliography:Application Number: WO2016JP75886