慶應義塾大学学術情報リポジトリ(KOARA)KeiO Associated Repository of Academic resources

慶應義塾大学学術情報リポジトリ(KOARA)

ホーム  »»  アイテム一覧  »»  アイテム詳細

アイテム詳細

アイテムタイプ Article
ID
AN00003152-00000047-0027  
プレビュー
画像
thumbnail  
キャプション  
本文
AN00003152-00000047-0027.pdf
Type :application/pdf Download
Size :778.3 KB
Last updated :Nov 13, 2008
Downloads : 2471

Total downloads since Nov 13, 2008 : 2471
 
本文公開日
 
タイトル
タイトル 大規模文献集合に対して階層的クラスタ分析法を適用するための単連結法アルゴリズム  
カナ ダイキボ ブンケン シュウゴウ ニ タイシテ カイソウテキ クラスタ ブンセキホウ オ テキヨウ スル タメ ノ タンレンケツホウ アルゴリズム  
ローマ字 Daikibo bunken shugo ni taishite kaisoteki kurasuta bunsekiho o tekiyo suru tame no tanrenketsuho arugorizumu  
別タイトル
名前 A single-link method algorithm for clustering large document collections  
カナ  
ローマ字  
著者
名前 岸田, 和明  
カナ キシダ, カズアキ  
ローマ字 Kishida, Kazuaki  
所属 駿河台大学文化情報学部  
所属(翻訳) Surugadai University  
役割  
外部リンク  
 
出版地
 
出版者
名前 三田図書館・情報学会  
カナ ミタ トショカン ジョウホウ ガッカイ  
ローマ字 Mita toshokan joho gakkai  
日付
出版年(from:yyyy) 2002  
出版年(to:yyyy)  
作成日(yyyy-mm-dd)  
更新日(yyyy-mm-dd)  
記録日(yyyy-mm-dd)  
形態
 
上位タイトル
名前 Library and information science  
翻訳  
 
47  
2002  
 
開始ページ 27  
終了ページ 38  
ISSN
03734447  
ISBN
 
DOI
URI
JaLCDOI
NII論文ID
 
医中誌ID
 
その他ID
 
博士論文情報
学位授与番号  
学位授与年月日  
学位名  
学位授与機関  
抄録
In the 1960s and 1970s, techniques for clustering a set of documents, in order to improvethe effectiveness or efficiency of information retrieval systems, have been widely explored.Similar attempts have recently been made by many researchers to allow the visualisation ofsearch results, to provide browsing based search modes or to enhance performance in searchingvery large collections. The purpose of this paper is to develop an algorithm for hierarchicalclustering that can work for very large document collections. The algorithm is based on acombination of two ideas proposed by other researchers to save time and space in the processof hierarchical clustering; (1) the use of an inverted file for reducing the number of documentpairs for which a similarity degree is calculated, and (2) a procedure for constructing adendrogram based on single-link method from similarity data recorded on disk and not themain memory. ln this paper, the algorithm is experimentally applied to a documentset consisting of about 10,000 bibliographic records, and the processing time is analyzedempirically. ln addition, the effects of removing words frequently appearing in documents areexamined. As a result, we find that removing such words enable us to greatly reduce theprocessing time without significant change in .the resulting set of clusters. Finally, an empiricalcomparison between the single-link method and the single-pass algorithm (leader-followeralgorithm) is attempted.
 
目次

 
キーワード
 
NDC
 
注記
短報
 
言語
日本語  
資源タイプ
text  
ジャンル
Journal Article  
著者版フラグ
publisher  
関連DOI
アクセス条件

 
最終更新日
Nov 12, 2008 17:13:46  
作成日
Apr 20, 2007 10:20:35  
所有者
mediacenter
 
更新履歴
Nov 12, 2008    フリーキーワード, 本文 を変更
 
インデックス
/ Public / 文学部 / [図書館・情報学] Library and information science / 47 (2002)
 
関連アイテム
 

ランキング

最も多く閲覧されたアイテム
1位 出生率及び教育投... (775) 1st
2位 『うつほ物語』俊... (474)
3位 新自由主義に抗す... (384)
4位 731部隊と細菌戦 ... (356)
5位 二〇二三年度三田... (269)

最も多くダウンロードされたアイテム
1位 Predicting crypt... (2455) 1st
2位 家族主義と個人主... (1905)
3位 731部隊と細菌戦 ... (574)
4位 猫オルガンとはな... (510)
5位 新参ファンと古参... (438)

LINK

慶應義塾ホームページへ
慶應義塾大学メディアセンターデジタルコレクション
慶應義塾大学メディアセンター本部
慶應義塾研究者情報データベース