慶應義塾大学学術情報リポジトリ(KOARA)KeiO Associated Repository of Academic resources

慶應義塾大学学術情報リポジトリ(KOARA)

ホーム  »»  アイテム一覧  »»  アイテム詳細

アイテム詳細

アイテムタイプ Article
ID
AN00003152-00000039-0031  
プレビュー
画像
thumbnail  
キャプション  
本文
AN00003152-00000039-0031.pdf
Type :application/pdf Download
Size :1.7 MB
Last updated :Apr 20, 2007
Downloads : 2774

Total downloads since Apr 20, 2007 : 2774
 
本文公開日
 
タイトル
タイトル 図書をNDCカテゴリに分類する試み  
カナ トショ オ NDC カテゴリ ニ ブンルイ スル ココロミ  
ローマ字 Tosho o NDC kategori ni bunrui suru kokoromi  
別タイトル
名前 An experiment of automatic classification of books using Nippon Decimal Classification  
カナ  
ローマ字  
著者
名前 石田, 栄美  
カナ イシダ, エミ  
ローマ字 Ishida, Emi  
所属 慶應義塾大学大学院文学研究科図書館・情報学専攻  
所属(翻訳) Graduate School of Library and Information Science, Keio University  
役割  
外部リンク  
 
出版地
 
出版者
名前 三田図書館・情報学会  
カナ ミタ トショカン ジョウホウ ガッカイ  
ローマ字 Mita toshokan joho gakkai  
日付
出版年(from:yyyy) 1998  
出版年(to:yyyy)  
作成日(yyyy-mm-dd)  
更新日(yyyy-mm-dd)  
記録日(yyyy-mm-dd)  
形態
 
上位タイトル
名前 Library and information science  
翻訳  
 
39  
1998  
 
開始ページ 31  
終了ページ 45  
ISSN
03734447  
ISBN
 
DOI
URI
JaLCDOI
NII論文ID
 
医中誌ID
 
その他ID
 
博士論文情報
学位授与番号  
学位授与年月日  
学位名  
学位授与機関  
抄録
In information retrie’val, texts are usually retrieved by them with queries. ln this study, anapproach was suggested that texts are automatically classified into categories and retrieved bymatching them with queries classified in the same way. For an efficient information retrievalusing automatic classification, extracting methods of words from texts and matching methodsare essential. Some extracting methods from Japanese texts have been suggested in naturallanguages processing. However, it is difiicult to extract significant words from Japanese textsbecause Japanese texts are written without blank space separating words. As for matchingmethods, many weighting methods have been suggested as well as vector space models andprobabilistic models.   This article reports the results of an experiment of classifying Japanese texts into NipponDecimal Classification (NDC) categories based on the title information in Japanese MARCrecords. ln this experiment, three extracting methods: 一一juman, MHSA, n-gram-are tested ona set of 1,000 books. Four weighting methods: 一relative term frequency between categories, tf・idf and tf (max)・idf一一一一一are tested. The results indicate that the extracting method using jumanachieved best and the best weighting method was the relative term frequency between categories, being able to select correct classification categories (upper three digits of NDC) for about55.99060 of 1,000 books.
 
目次

 
キーワード
 
NDC
 
注記

 
言語
日本語  
資源タイプ
text  
ジャンル
Journal Article  
著者版フラグ
publisher  
関連DOI
アクセス条件

 
最終更新日
Apr 19, 2024 15:49:22  
作成日
Apr 20, 2007 10:27:03  
所有者
mediacenter
 
更新履歴
 
インデックス
/ Public / 文学部 / [図書館・情報学] Library and information science / 39 (1998)
 
関連アイテム
 

ランキング

最も多く閲覧されたアイテム
1位 二〇二三年度三田... (734) 1st
2位 出生率及び教育投... (554)
3位 『うつほ物語』俊... (437)
4位 新自由主義に抗す... (412)
5位 731部隊と細菌戦 ... (319)

最も多くダウンロードされたアイテム
1位 Predicting crypt... (2452) 1st
2位 家族主義と個人主... (1809)
3位 731部隊と細菌戦 ... (736)
4位 新参ファンと古参... (438)
5位 猫オルガンとはな... (383)

LINK

慶應義塾ホームページへ
慶應義塾大学メディアセンターデジタルコレクション
慶應義塾大学メディアセンター本部
慶應義塾研究者情報データベース