統語依存関係に基づく位相研究 文章ジャンルの位相差を対象に
本研究では,異なる文章ジャンル間の相違点と共通点を把握するために,統語情報が付与された日本語コーパス,具体的には「現代日本語書き言葉均衡コーパス」(国立国語研究所)のコアデータのツリーバンクである「UD Japanese-BCCWJ」を利用し,白書,新聞,書籍,雑誌,Yahoo!ブログ,Yahoo!知恵袋の6つのジャンル間で統語依存関係,統語複雑度,依存方向において位相差があるか否かを考察した。その結果,統語依存関係,統語複雑度,依存方向はジャンルごとに異なっており,これらの指標は内容語か機能語かといった指標と同様に,文章ジャンルの特徴をある程度反映していることがわかった。また,統語複雑度と関...
Saved in:
Published in | 言語研究 Vol. 162; pp. 47 - 62 |
---|---|
Main Authors | , , |
Format | Journal Article |
Language | Japanese |
Published |
日本言語学会
2022
|
Subjects | |
Online Access | Get full text |
ISSN | 0024-3914 2185-6710 |
DOI | 10.11435/gengo.162.0_47 |
Cover
Summary: | 本研究では,異なる文章ジャンル間の相違点と共通点を把握するために,統語情報が付与された日本語コーパス,具体的には「現代日本語書き言葉均衡コーパス」(国立国語研究所)のコアデータのツリーバンクである「UD Japanese-BCCWJ」を利用し,白書,新聞,書籍,雑誌,Yahoo!ブログ,Yahoo!知恵袋の6つのジャンル間で統語依存関係,統語複雑度,依存方向において位相差があるか否かを考察した。その結果,統語依存関係,統語複雑度,依存方向はジャンルごとに異なっており,これらの指標は内容語か機能語かといった指標と同様に,文章ジャンルの特徴をある程度反映していることがわかった。また,統語複雑度と関係する依存距離は最小化される傾向があるという位相間に共通の法則が見られた。 |
---|---|
ISSN: | 0024-3914 2185-6710 |
DOI: | 10.11435/gengo.162.0_47 |