語意類似度を用いた指示代名詞の照応解析システムAnasysD
照応詞と照応関係にある先行詞を同定することは,ロボット対話や質問応答などの自然言語処理の応用研究において,高精度を達成するために必要な要素技術とされている.そこで意味解析システムSAGEを用いて文を意味解析し,語間の意味的類似度を用いて指示代名詞の先行詞を高精度に同定する照応解析システムAnasysDを開発した.先行詞らしさを数値化するために,先行詞文節と照応詞の受け側文節との共起類似度素性や先行詞文節の上位概念分類と先行詞文節の深層格による2次元の事後確率など12種類の素性を設定した.NAISTテキストコーパスを用いてナイーブベイズ法で正解率の確率分布を学習し,先行詞らしさの確率が最も高い文...
Saved in:
Published in | 知能と情報 Vol. 31; no. 5; pp. 797 - 807 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Japanese |
Published |
日本知能情報ファジィ学会
15.10.2019
|
Subjects | |
Online Access | Get full text |
ISSN | 1347-7986 1881-7203 |
DOI | 10.3156/jsoft.31.5_797 |
Cover
Summary: | 照応詞と照応関係にある先行詞を同定することは,ロボット対話や質問応答などの自然言語処理の応用研究において,高精度を達成するために必要な要素技術とされている.そこで意味解析システムSAGEを用いて文を意味解析し,語間の意味的類似度を用いて指示代名詞の先行詞を高精度に同定する照応解析システムAnasysDを開発した.先行詞らしさを数値化するために,先行詞文節と照応詞の受け側文節との共起類似度素性や先行詞文節の上位概念分類と先行詞文節の深層格による2次元の事後確率など12種類の素性を設定した.NAISTテキストコーパスを用いてナイーブベイズ法で正解率の確率分布を学習し,先行詞らしさの確率が最も高い文節を先行詞文節とする.5分割交差検定で評価した結果,63.42%の精度を達成した. |
---|---|
ISSN: | 1347-7986 1881-7203 |
DOI: | 10.3156/jsoft.31.5_797 |