統語依存関係に基づく位相研究 文章ジャンルの位相差を対象に

本研究では,異なる文章ジャンル間の相違点と共通点を把握するために,統語情報が付与された日本語コーパス,具体的には「現代日本語書き言葉均衡コーパス」(国立国語研究所)のコアデータのツリーバンクである「UD Japanese-BCCWJ」を利用し,白書,新聞,書籍,雑誌,Yahoo!ブログ,Yahoo!知恵袋の6つのジャンル間で統語依存関係,統語複雑度,依存方向において位相差があるか否かを考察した。その結果,統語依存関係,統語複雑度,依存方向はジャンルごとに異なっており,これらの指標は内容語か機能語かといった指標と同様に,文章ジャンルの特徴をある程度反映していることがわかった。また,統語複雑度と関...

Full description

Saved in:
Bibliographic Details
Published in言語研究 Vol. 162; pp. 47 - 62
Main Authors 小森, 早江子, 李, 文平, 劉, 海濤
Format Journal Article
LanguageJapanese
Published 日本言語学会 2022
Subjects
Online AccessGet full text
ISSN0024-3914
2185-6710
DOI10.11435/gengo.162.0_47

Cover

More Information
Summary:本研究では,異なる文章ジャンル間の相違点と共通点を把握するために,統語情報が付与された日本語コーパス,具体的には「現代日本語書き言葉均衡コーパス」(国立国語研究所)のコアデータのツリーバンクである「UD Japanese-BCCWJ」を利用し,白書,新聞,書籍,雑誌,Yahoo!ブログ,Yahoo!知恵袋の6つのジャンル間で統語依存関係,統語複雑度,依存方向において位相差があるか否かを考察した。その結果,統語依存関係,統語複雑度,依存方向はジャンルごとに異なっており,これらの指標は内容語か機能語かといった指標と同様に,文章ジャンルの特徴をある程度反映していることがわかった。また,統語複雑度と関係する依存距離は最小化される傾向があるという位相間に共通の法則が見られた。
ISSN:0024-3914
2185-6710
DOI:10.11435/gengo.162.0_47