アイテムタイプ |
Article |
ID |
|
プレビュー |
画像 |
|
キャプション |
|
|
本文 |
AN00003152-00000056-0043.pdf
Type |
:application/pdf |
Download
|
Size |
:1.6 MB
|
Last updated |
:May 18, 2009 |
Downloads |
: 1713 |
Total downloads since May 18, 2009 : 1713
|
|
本文公開日 |
|
タイトル |
タイトル |
日本語学術論文PDFファイルの自動判定
|
カナ |
ニホンゴ ガクジュツ ロンブン PDF ファイル ノ ジドウ ハンテイ
|
ローマ字 |
nihongo gakujutsu ronbun PDF fairu no jido hantei
|
|
別タイトル |
名前 |
Automatic identification of academic articles in Japanese PDF files
|
カナ |
|
ローマ字 |
|
|
著者 |
名前 |
安形, 輝
|
カナ |
アガタ, テル
|
ローマ字 |
Teru, Agata
|
所属 |
亜細亜大学
|
所属(翻訳) |
Asia University
|
役割 |
|
外部リンク |
|
名前 |
池内, 淳
|
カナ |
イケウチ, アツシ
|
ローマ字 |
Ikeuchi, Atsudhi
|
所属 |
大東文化大学
|
所属(翻訳) |
Daito Bunka University
|
役割 |
|
外部リンク |
|
名前 |
石田, 栄美
|
カナ |
イシダ, エミ
|
ローマ字 |
Ishida, Emi
|
所属 |
駿河台大学
|
所属(翻訳) |
Surugadai University
|
役割 |
|
外部リンク |
|
名前 |
野末, 道子
|
カナ |
ノズエ, ミチコ
|
ローマ字 |
Nozue, Michiko
|
所属 |
鉄道総合技術研究所
|
所属(翻訳) |
Railway Technical Research Institute
|
役割 |
|
外部リンク |
|
名前 |
久野, 高志
|
カナ |
クノ, タカシ
|
ローマ字 |
Kuno, Takashi
|
所属 |
作新学院大学
|
所属(翻訳) |
Sakushingakuin University
|
役割 |
|
外部リンク |
|
名前 |
上田, 修一
|
カナ |
ウエダ, シュウイチ
|
ローマ字 |
Ueda, Shuichi
|
所属 |
慶應義塾大学
|
所属(翻訳) |
Keio University
|
役割 |
|
外部リンク |
|
|
版 |
|
出版地 |
|
出版者 |
名前 |
三田図書館・情報学会
|
カナ |
ミタ トショカン ジョウホウ ガッカイ
|
ローマ字 |
Mita toshokan joho gakkai
|
|
日付 |
出版年(from:yyyy) |
2006
|
出版年(to:yyyy) |
|
作成日(yyyy-mm-dd) |
|
更新日(yyyy-mm-dd) |
|
記録日(yyyy-mm-dd) |
|
|
形態 |
|
上位タイトル |
名前 |
Library and information science
|
翻訳 |
|
巻 |
|
号 |
56
|
年 |
2006
|
月 |
|
開始ページ |
43
|
終了ページ |
63
|
|
ISSN |
|
ISBN |
|
DOI |
|
URI |
|
JaLCDOI |
|
NII論文ID |
|
医中誌ID |
|
その他ID |
|
博士論文情報 |
学位授与番号 |
|
学位授与年月日 |
|
学位名 |
|
学位授与機関 |
|
|
抄録 |
As open-access policies gain acceptance, an increasing number of researchers are contributing their papers to publicly accessible web sites (i.e. self-archiving). Theoretically, these papers are accessible from standard search engines, but they tend to be obscured by other contents on the web. The purpose of this research is to develop a system that can automatically detect academic articles and/or quasi-academic articles on the web. This paper describes experiments that were conducted on the performance of various classifiers and the results are compared in terms of precision, recall, and F-measure. The classifiers use attributes such as terms in PDF files and empirical rules. The results suggest the effciency of a ranked output system which has several phases to identify academic articles.
オープンアクセス環境が進展するにつれ、セルフアーカイビングの形式で自らの研究成果を公開する研究者が増加している。そのような成果は、従来のすべてのウェブを対象とする検索エンジンからもアクセスが可能ではあるが、検索結果中の他のものに埋没してしまうことが多い。そこで、本研究ではウェブコンテンツ中からの学術論文、あるいは論文に準ずるコンテンツを判定するシステム構築を目指し、SVM など、多くの手法を用いて自動判定実験を行った。自動判定の手がかりとなる属性群としてはファイル中に出現する語と経験的なルール群を用いた。実験結果からは、段階的な論文判定を行うことで、学術情報専門の検索システム構築が実現可能であることが示唆された。
|
|
目次 |
|
キーワード |
|
NDC |
|
注記 |
|
言語 |
|
資源タイプ |
|
ジャンル |
|
著者版フラグ |
|
関連DOI |
|
アクセス条件 |
|
最終更新日 |
|
作成日 |
|
所有者 |
|
更新履歴 |
|
インデックス |
|
関連アイテム |
|