PHRASE TABLE GENERATING APPARATUS, MACHINE TRANSLATION APPARATUS, AND PROGRAM
PROBLEM TO BE SOLVED: To solve the problem in which: the size of a phrase table used in phrase-based statistical machine translation cannot be easily reduced conventionally.SOLUTION: The size of a phrase table used in phrase-based statistical machine translation can be easily reduced by a phrase tab...
Saved in:
Main Author | |
---|---|
Format | Patent |
Language | English Japanese |
Published |
19.07.2018
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | PROBLEM TO BE SOLVED: To solve the problem in which: the size of a phrase table used in phrase-based statistical machine translation cannot be easily reduced conventionally.SOLUTION: The size of a phrase table used in phrase-based statistical machine translation can be easily reduced by a phrase table generating apparatus comprising: a phrase pair acquisition unit acquiring a phrase pair set that is two or more phrase pairs from bilingual data having an original sentence and a translated sentence for each of two or more different word alignment techniques using two or more different respective word alignment techniques; an intersection acquisition unit acquiring one or more phrase pairs common among two or more phrase pair sets; and an accumulation unit accumulating the phrase table having one or more entries having one or more phrase pairs acquired by the intersection acquisition unit in a phrase table storage unit.SELECTED DRAWING: Figure 1
【課題】従来、フレーズベース統計的機械翻訳で使用するフレーズテーブルのサイズを容易に削減できなかった。【解決手段】2以上の異なる各単語アライメント手法を用いて、2以上の異なる単語アライメント手法ごとに、2以上のフレーズペアであるフレーズペア集合を、原文と訳文とを有する対訳データから取得するフレーズペア取得部と、2以上のフレーズペア集合の中で共通する1以上のフレーズペアを取得する積集合取得部と、積集合取得部が取得した1以上のフレーズペアを有する1以上のエントリを有するフレーズテーブルをフレーズテーブル格納部へ蓄積する蓄積部とを具備するフレーズテーブル生成装置により、フレーズベース統計的機械翻訳で使用するフレーズテーブルのサイズを、容易に削減できる。【選択図】図1 |
---|---|
Bibliography: | Application Number: JP20170001583 |