本研究の究極の目的は、現代日本語の構文を、「フレーム知識」を介して英語・独語・スウェーデン語・中国語などの言語類型論的に異なる言語の構文と対応付け、マルチリンガル構文資源を構築することである。マルチリンガル構文資源を構築するには、同じ意味・機能を持つ多言語の構文同士を対応付ける必要があるが、一般に言語類型論的に異なる言語間では構文の対応付けが困難と考えられている。本研究では、「フレーム・構文分析」手法を用いれば、構造は異なるが同じ意味や機能を持つ日英語間の構文同士を対応付けられることを検証する。
初年度の2020年度は、1)日本語文に対して構文アノテーション(注釈付け)を行い、2)それに基づき対応する日英語文の「フレーム・構文分析」を行った。1)を、マルチリンガル構文資源構築共同プロジェクト全体で選定した、話し言葉コーパス(TEDトークの字幕)と書き言葉コーパス(小説『星の王子さま』の対訳)の日本語版に対して行った。2)を、上記の話し言葉コーパスと書き言葉コーパスに対して行った。
その結果、i) 話し言葉・書き言葉の両方に対して「フレーム・構文分析」の手法が有効であることが判明した。ii)文の主部に注目することで、言語類型論的に異なる日本語と英語のような言語ペアに対しても対応する構文が同定できることが判明した。iii)日英語で文構造と主部の意味が異なる文同士でも、文の機能が一致する場合には日英の構文が対応するとみなせることが判明した。
The project aims to build a multilingual "constructicon," that is, a network of related constructions, by linking grammatical constructions in Japanese with those in English, German, Swedish, Porgueses, and Chinese via semantic frames.
Specifically, the project tries to demonstrate the validity of frames-and-constructions analysis to search for corresponding constructions in typologically unrelated languages such as Japanese and English.
The findings in 2020 involve the following: i) the proposed frames-and-constructions analysis method seems valid not only for written language but also for spoken data; ii) The proposed frames-and-constructions analysis method, i.e., the one that focuses on the head of a sentence in each language, seems valid to search for corresponding constructions in typologically-unrelated languages; iii) even in the case of frame mismatch, and even when structural divergence exists, if the functions of two constructions in the two languages are the same, then the two constructions are comparable.
|