慶應義塾大学学術情報リポジトリ(KOARA)KeiO Associated Repository of Academic resources

慶應義塾大学学術情報リポジトリ(KOARA)

ホーム  »»  アイテム一覧  »»  アイテム詳細

アイテム詳細

アイテムタイプ Article
ID
2017000001-20170071  
プレビュー
画像
thumbnail  
キャプション  
本文
2017000001-20170071.pdf
Type :application/pdf Download
Size :121.5 KB
Last updated :Feb 21, 2019
Downloads : 299

Total downloads since Feb 21, 2019 : 299
 
本文公開日
 
タイトル
タイトル 深い意味処理のための統合日本語コーパスの開発と言語研究  
カナ フカイ イミ ショリ ノ タメ ノ トウゴウ ニホンゴ コーパス ノ カイハツ ト ゲンゴ ケンキュウ  
ローマ字 Fukai imi shori no tame no tōgō Nihongo kōpasu no kaihatsu to gengo kenkyū  
別タイトル
名前 Linguistic study and development of an integrated Japanese corpus for deep semantic processing  
カナ  
ローマ字  
著者
名前 小原, 京子  
カナ オハラ, キョウコ  
ローマ字 Ohara, Kyoko  
所属 慶應義塾大学理工学部教授  
所属(翻訳)  
役割 Research team head  
外部リンク  
 
出版地
 
出版者
名前 慶應義塾大学  
カナ ケイオウ ギジュク ダイガク  
ローマ字 Keiō gijuku daigaku  
日付
出版年(from:yyyy) 2018  
出版年(to:yyyy)  
作成日(yyyy-mm-dd)  
更新日(yyyy-mm-dd)  
記録日(yyyy-mm-dd)  
形態
1 pdf  
上位タイトル
名前 学事振興資金研究成果実績報告書  
翻訳  
 
 
2017  
 
開始ページ  
終了ページ  
ISSN
 
ISBN
 
DOI
URI
JaLCDOI
NII論文ID
 
医中誌ID
 
その他ID
 
博士論文情報
学位授与番号  
学位授与年月日  
学位名  
学位授与機関  
抄録
本研究の究極的な目的は, 研究代表者が構築した認知言語学に基づく詳細な意味情報を付与した言語資源「日本語フレームネット」(JFN)を, 言語研究のみならず自然言語処理にとってもこれまで以上に有益な言語資源とする方策を検討することである。そのためには, JFNの規模を大きくさせることと, JFNの持つ豊富な意味情報に加え統語情報をも含める, という2つの方向性が考えられる。本研究では特に, 国立国語研究所で構築中のNINJAL Parsed Corpus of Modern Japanese (NPCMJ)とリンクさせることを検討した。NPCMJは文の統語情報のみで意味情報は含まないが規模は大きいのに対JFNは詳細な意味情報を含むが規模が小さく, 両者を統合することで深い意味処理を行う自然言語処理アプリケーションのための言語資源とすることができると考えたからである。
当初計画したJFNとNPCMJのリンク方法は2つあった。一つ目は, JFNで意味情報付与の際の入力データとしてNPCMJの統語情報付きデータを用いることである。二つ目は, JFNとNPCMJを統合させ, 認知科学的にも妥当な詳細な意味情報と文の統語情報の両方を含んだコーパスとすることである。前者に関しては, ツールを開発した。後者については実現までの目処がたった。
本研究の経過・成果は, 国際認知言語学会, マルチリンガルフレームネット会議, 言語処理学会第24回年次大会にて発表した。
本研究によりNPCMJとJFNの統合は実現可能であることが明らかとなった。今後はJFNを深い意味処理を行う自然言語処理アプリケーションにとってさらに有益な資源とするため, より規模の大きく自然言語処理分野で定評のある言語資源とのリンクを検討したい。
The principal investigator (PI) of this research project has been developing Japanese FrameNet (JFN), a language resource that contains rich semantic information which is based on the theory of Frame Semantics. The ultimate goal of this research project is to enable JFN to be useful for natural language processing (NLP) applications, especially for those that involve deep semantic processing. In order to achieve this goal, there are two directions. One is to make the size of JFN larger. The other is to add syntactic information to JFN, in addition to the existing semantic information. This research project pursued the latter approach and focused on ways to link the JFN data with the NINJAL (National Institute for Japanese Language and Linguistics) Parsed Corpus of Modern Japanese (NPCMJ). NPCMJ does not contain semantic information at all but includes detailed syntactic information of sentences and its size is larger than that of JFN. Therefore, it was expected that the combined language resource would be useful for various NLP applications.
There are two ways to link the JFN data with that of NPCMJ. One is to use the NPCMJ data as input to the JFN annotation (tagging) process. The other is to integrate JFN and NPCMJ to build a combined corpus. As for the former, a tool was implemented to allow the NPCMJ data as input to the JFN annotation process. As for the latter, how to combine the two resources was investigated.
The accomplishments of the project were presented at ICLC14 (Tartu, Estonia ; July 2017), the Multilingual FrameNet meeting (Vancouver, Canada ; Aug. 2017), and NLP2018 (Okayama, Mar. 2018).
Through this research project, we were able to confirm that NPCMJ and JFN can be combined. Future plans include attempting to link JFN with a language resource which is more suitable for semantic-processing NLP applications and which is larger than NPCMJ.
 
目次

 
キーワード
 
NDC
 
注記

 
言語
日本語  

英語  
資源タイプ
text  
ジャンル
Research Paper  
著者版フラグ
publisher  
関連DOI
アクセス条件

 
最終更新日
Feb 21, 2019 13:10:01  
作成日
Feb 21, 2019 13:10:01  
所有者
mediacenter
 
更新履歴
Feb 21, 2019    インデックス を変更
 
インデックス
/ Public / 塾内助成報告書 / 学事振興資金研究成果実績報告書 / 2017年度
 
関連アイテム
 

ランキング

最も多く閲覧されたアイテム
1位 二〇二三年度三田... (734) 1st
2位 出生率及び教育投... (554)
3位 『うつほ物語』俊... (437)
4位 新自由主義に抗す... (412)
5位 731部隊と細菌戦 ... (319)

最も多くダウンロードされたアイテム
1位 Predicting crypt... (2452) 1st
2位 家族主義と個人主... (1809)
3位 731部隊と細菌戦 ... (736)
4位 新参ファンと古参... (438)
5位 猫オルガンとはな... (383)

LINK

慶應義塾ホームページへ
慶應義塾大学メディアセンターデジタルコレクション
慶應義塾大学メディアセンター本部
慶應義塾研究者情報データベース