慶應義塾大学学術情報リポジトリ(KOARA)KeiO Associated Repository of Academic resources

慶應義塾大学学術情報リポジトリ(KOARA)

Home  »»  Listing item  »»  Detail

Detail

Item Type Article
ID
AN00003152-00000056-0043  
Preview
Image
thumbnail  
Caption  
Full text
AN00003152-00000056-0043.pdf
Type :application/pdf Download
Size :1.6 MB
Last updated :May 18, 2009
Downloads : 1814

Total downloads since May 18, 2009 : 1814
 
Release Date
 
Title
Title 日本語学術論文PDFファイルの自動判定  
Kana ニホンゴ ガクジュツ ロンブン PDF ファイル ノ ジドウ ハンテイ  
Romanization nihongo gakujutsu ronbun PDF fairu no jido hantei  
Other Title
Title Automatic identification of academic articles in Japanese PDF files  
Kana  
Romanization  
Creator
Name 安形, 輝  
Kana アガタ, テル  
Romanization Teru, Agata  
Affiliation 亜細亜大学  
Affiliation (Translated) Asia University  
Role  
Link  

Name 池内, 淳  
Kana イケウチ, アツシ  
Romanization Ikeuchi, Atsudhi  
Affiliation 大東文化大学  
Affiliation (Translated) Daito Bunka University  
Role  
Link  

Name 石田, 栄美  
Kana イシダ, エミ  
Romanization Ishida, Emi  
Affiliation 駿河台大学  
Affiliation (Translated) Surugadai University  
Role  
Link  

Name 野末, 道子  
Kana ノズエ, ミチコ  
Romanization Nozue, Michiko  
Affiliation 鉄道総合技術研究所  
Affiliation (Translated) Railway Technical Research Institute  
Role  
Link  

Name 久野, 高志  
Kana クノ, タカシ  
Romanization Kuno, Takashi  
Affiliation 作新学院大学  
Affiliation (Translated) Sakushingakuin University  
Role  
Link  

Name 上田, 修一  
Kana ウエダ, シュウイチ  
Romanization Ueda, Shuichi  
Affiliation 慶應義塾大学  
Affiliation (Translated) Keio University  
Role  
Link  
Edition
 
Place
東京  
Publisher
Name 三田図書館・情報学会  
Kana ミタ トショカン ジョウホウ ガッカイ  
Romanization Mita toshokan joho gakkai  
Date
Issued (from:yyyy) 2006  
Issued (to:yyyy)  
Created (yyyy-mm-dd)  
Updated (yyyy-mm-dd)  
Captured (yyyy-mm-dd)  
Physical description
 
Source Title
Name Library and information science  
Name (Translated)  
Volume  
Issue 56  
Year 2006  
Month  
Start page 43  
End page 63  
ISSN
03734447  
ISBN
 
DOI
URI
JaLCDOI
NII Article ID
 
Ichushi ID
 
Other ID
 
Doctoral dissertation
Dissertation Number  
Date of granted  
Degree name  
Degree grantor  
Abstract
As open-access policies gain acceptance, an increasing number of researchers are contributing their papers to publicly accessible web sites (i.e. self-archiving). Theoretically, these papers are accessible from standard search engines, but they tend to be obscured by other contents on the web. The purpose of this research is to develop a system that can automatically detect academic articles and/or quasi-academic articles on the web. This paper describes experiments that were conducted on the performance of various classifiers and the results are compared in terms of precision, recall, and F-measure. The classifiers use attributes such as terms in PDF files and empirical rules. The results suggest the effciency of a ranked output system which has several phases to identify academic articles.
オープンアクセス環境が進展するにつれ、セルフアーカイビングの形式で自らの研究成果を公開する研究者が増加している。そのような成果は、従来のすべてのウェブを対象とする検索エンジンからもアクセスが可能ではあるが、検索結果中の他のものに埋没してしまうことが多い。そこで、本研究ではウェブコンテンツ中からの学術論文、あるいは論文に準ずるコンテンツを判定するシステム構築を目指し、SVM など、多くの手法を用いて自動判定実験を行った。自動判定の手がかりとなる属性群としてはファイル中に出現する語と経験的なルール群を用いた。実験結果からは、段階的な論文判定を行うことで、学術情報専門の検索システム構築が実現可能であることが示唆された。
 
Table of contents

 
Keyword
 
NDC
 
Note
原著論文
 
Language
日本語  
Type of resource
text  
Genre
Journal Article  
Text version
publisher  
Related DOI
Access conditions

 
Last modified date
May 18, 2009 09:00:00  
Creation date
May 18, 2009 09:00:00  
Registerd by
mediacenter
 
History
 
Index
/ Public / Faculty of Letters / Library and information science / 56 (2006)
 
Related to