慶應義塾大学学術情報リポジトリ(KOARA)KeiO Associated Repository of Academic resources

慶應義塾大学学術情報リポジトリ(KOARA)

Home  »»  Listing item  »»  Detail

Detail

Item Type Article
ID
2017000001-20170071  
Preview
Image
thumbnail  
Caption  
Full text
2017000001-20170071.pdf
Type :application/pdf Download
Size :121.5 KB
Last updated :Feb 21, 2019
Downloads : 303

Total downloads since Feb 21, 2019 : 303
 
Release Date
 
Title
Title 深い意味処理のための統合日本語コーパスの開発と言語研究  
Kana フカイ イミ ショリ ノ タメ ノ トウゴウ ニホンゴ コーパス ノ カイハツ ト ゲンゴ ケンキュウ  
Romanization Fukai imi shori no tame no tōgō Nihongo kōpasu no kaihatsu to gengo kenkyū  
Other Title
Title Linguistic study and development of an integrated Japanese corpus for deep semantic processing  
Kana  
Romanization  
Creator
Name 小原, 京子  
Kana オハラ, キョウコ  
Romanization Ohara, Kyoko  
Affiliation 慶應義塾大学理工学部教授  
Affiliation (Translated)  
Role Research team head  
Link  
Edition
 
Place
 
Publisher
Name 慶應義塾大学  
Kana ケイオウ ギジュク ダイガク  
Romanization Keiō gijuku daigaku  
Date
Issued (from:yyyy) 2018  
Issued (to:yyyy)  
Created (yyyy-mm-dd)  
Updated (yyyy-mm-dd)  
Captured (yyyy-mm-dd)  
Physical description
1 pdf  
Source Title
Name 学事振興資金研究成果実績報告書  
Name (Translated)  
Volume  
Issue  
Year 2017  
Month  
Start page  
End page  
ISSN
 
ISBN
 
DOI
URI
JaLCDOI
NII Article ID
 
Ichushi ID
 
Other ID
 
Doctoral dissertation
Dissertation Number  
Date of granted  
Degree name  
Degree grantor  
Abstract
本研究の究極的な目的は, 研究代表者が構築した認知言語学に基づく詳細な意味情報を付与した言語資源「日本語フレームネット」(JFN)を, 言語研究のみならず自然言語処理にとってもこれまで以上に有益な言語資源とする方策を検討することである。そのためには, JFNの規模を大きくさせることと, JFNの持つ豊富な意味情報に加え統語情報をも含める, という2つの方向性が考えられる。本研究では特に, 国立国語研究所で構築中のNINJAL Parsed Corpus of Modern Japanese (NPCMJ)とリンクさせることを検討した。NPCMJは文の統語情報のみで意味情報は含まないが規模は大きいのに対JFNは詳細な意味情報を含むが規模が小さく, 両者を統合することで深い意味処理を行う自然言語処理アプリケーションのための言語資源とすることができると考えたからである。
当初計画したJFNとNPCMJのリンク方法は2つあった。一つ目は, JFNで意味情報付与の際の入力データとしてNPCMJの統語情報付きデータを用いることである。二つ目は, JFNとNPCMJを統合させ, 認知科学的にも妥当な詳細な意味情報と文の統語情報の両方を含んだコーパスとすることである。前者に関しては, ツールを開発した。後者については実現までの目処がたった。
本研究の経過・成果は, 国際認知言語学会, マルチリンガルフレームネット会議, 言語処理学会第24回年次大会にて発表した。
本研究によりNPCMJとJFNの統合は実現可能であることが明らかとなった。今後はJFNを深い意味処理を行う自然言語処理アプリケーションにとってさらに有益な資源とするため, より規模の大きく自然言語処理分野で定評のある言語資源とのリンクを検討したい。
The principal investigator (PI) of this research project has been developing Japanese FrameNet (JFN), a language resource that contains rich semantic information which is based on the theory of Frame Semantics. The ultimate goal of this research project is to enable JFN to be useful for natural language processing (NLP) applications, especially for those that involve deep semantic processing. In order to achieve this goal, there are two directions. One is to make the size of JFN larger. The other is to add syntactic information to JFN, in addition to the existing semantic information. This research project pursued the latter approach and focused on ways to link the JFN data with the NINJAL (National Institute for Japanese Language and Linguistics) Parsed Corpus of Modern Japanese (NPCMJ). NPCMJ does not contain semantic information at all but includes detailed syntactic information of sentences and its size is larger than that of JFN. Therefore, it was expected that the combined language resource would be useful for various NLP applications.
There are two ways to link the JFN data with that of NPCMJ. One is to use the NPCMJ data as input to the JFN annotation (tagging) process. The other is to integrate JFN and NPCMJ to build a combined corpus. As for the former, a tool was implemented to allow the NPCMJ data as input to the JFN annotation process. As for the latter, how to combine the two resources was investigated.
The accomplishments of the project were presented at ICLC14 (Tartu, Estonia ; July 2017), the Multilingual FrameNet meeting (Vancouver, Canada ; Aug. 2017), and NLP2018 (Okayama, Mar. 2018).
Through this research project, we were able to confirm that NPCMJ and JFN can be combined. Future plans include attempting to link JFN with a language resource which is more suitable for semantic-processing NLP applications and which is larger than NPCMJ.
 
Table of contents

 
Keyword
 
NDC
 
Note

 
Language
日本語  

英語  
Type of resource
text  
Genre
Research Paper  
Text version
publisher  
Related DOI
Access conditions

 
Last modified date
Feb 21, 2019 13:10:01  
Creation date
Feb 21, 2019 13:10:01  
Registerd by
mediacenter
 
History
Feb 21, 2019    インデックス を変更
 
Index
/ Public / Internal Research Fund / Keio Gijuku Academic Development Funds Report / Academic year 2017
 
Related to