アイテムタイプ |
Article |
ID |
|
プレビュー |
画像 |
|
キャプション |
|
|
本文 |
AN00003152-00000047-0027.pdf
Type |
:application/pdf |
Download
|
Size |
:778.3 KB
|
Last updated |
:Nov 13, 2008 |
Downloads |
: 2471 |
Total downloads since Nov 13, 2008 : 2471
|
|
本文公開日 |
|
タイトル |
タイトル |
大規模文献集合に対して階層的クラスタ分析法を適用するための単連結法アルゴリズム
|
カナ |
ダイキボ ブンケン シュウゴウ ニ タイシテ カイソウテキ クラスタ ブンセキホウ オ テキヨウ スル タメ ノ タンレンケツホウ アルゴリズム
|
ローマ字 |
Daikibo bunken shugo ni taishite kaisoteki kurasuta bunsekiho o tekiyo suru tame no tanrenketsuho arugorizumu
|
|
別タイトル |
名前 |
A single-link method algorithm for clustering large document collections
|
カナ |
|
ローマ字 |
|
|
著者 |
名前 |
岸田, 和明
|
カナ |
キシダ, カズアキ
|
ローマ字 |
Kishida, Kazuaki
|
所属 |
駿河台大学文化情報学部
|
所属(翻訳) |
Surugadai University
|
役割 |
|
外部リンク |
|
|
版 |
|
出版地 |
|
出版者 |
名前 |
三田図書館・情報学会
|
カナ |
ミタ トショカン ジョウホウ ガッカイ
|
ローマ字 |
Mita toshokan joho gakkai
|
|
日付 |
出版年(from:yyyy) |
2002
|
出版年(to:yyyy) |
|
作成日(yyyy-mm-dd) |
|
更新日(yyyy-mm-dd) |
|
記録日(yyyy-mm-dd) |
|
|
形態 |
|
上位タイトル |
名前 |
Library and information science
|
翻訳 |
|
巻 |
|
号 |
47
|
年 |
2002
|
月 |
|
開始ページ |
27
|
終了ページ |
38
|
|
ISSN |
|
ISBN |
|
DOI |
|
URI |
|
JaLCDOI |
|
NII論文ID |
|
医中誌ID |
|
その他ID |
|
博士論文情報 |
学位授与番号 |
|
学位授与年月日 |
|
学位名 |
|
学位授与機関 |
|
|
抄録 |
In the 1960s and 1970s, techniques for clustering a set of documents, in order to improvethe effectiveness or efficiency of information retrieval systems, have been widely explored.Similar attempts have recently been made by many researchers to allow the visualisation ofsearch results, to provide browsing based search modes or to enhance performance in searchingvery large collections. The purpose of this paper is to develop an algorithm for hierarchicalclustering that can work for very large document collections. The algorithm is based on acombination of two ideas proposed by other researchers to save time and space in the processof hierarchical clustering; (1) the use of an inverted file for reducing the number of documentpairs for which a similarity degree is calculated, and (2) a procedure for constructing adendrogram based on single-link method from similarity data recorded on disk and not themain memory. ln this paper, the algorithm is experimentally applied to a documentset consisting of about 10,000 bibliographic records, and the processing time is analyzedempirically. ln addition, the effects of removing words frequently appearing in documents areexamined. As a result, we find that removing such words enable us to greatly reduce theprocessing time without significant change in .the resulting set of clusters. Finally, an empiricalcomparison between the single-link method and the single-pass algorithm (leader-followeralgorithm) is attempted.
|
|
目次 |
|
キーワード |
|
NDC |
|
注記 |
|
言語 |
|
資源タイプ |
|
ジャンル |
|
著者版フラグ |
|
関連DOI |
|
アクセス条件 |
|
最終更新日 |
|
作成日 |
|
所有者 |
|
更新履歴 |
Nov 12, 2008 | | フリーキーワード, 本文 を変更 |
|
|
インデックス |
|
関連アイテム |
|