Upgrade to Pro — share decks privately, control downloads, hide ads and more …

c4ljp2015_journal_list

Kosuke Tanabe
September 05, 2015

 c4ljp2015_journal_list

Code4Lib JAPAN Conference 2015「ジャーナルリスト徹底活用法 - 楽しい電子ジャーナル管理のために -」
補足資料: https://github.com/nabeta/c4ljp2015/wiki

Kosuke Tanabe

September 05, 2015
Tweet

More Decks by Kosuke Tanabe

Other Decks in Technology

Transcript

  1. EssenOal  Science  Indicatorsの   ジャーナルリスト •  Thomson  Reuter社の論文データベース   – Web

     of  Scienceの収録誌のリスト   – h@p://ipscience-­‐help.thomsonreuters.com/ incitesLive/ESIGroup/overviewESI/ scopeCoverageESI.html   •  タイトル、ISSN、研究分野を含む   •  Web上で誰でも入手可能。ライセンスは不明
  2. DOAJのジャーナルリスト •  オープンアクセスジャーナルの一覧   •  CSVファイルで提供   – h@ps://doaj.org/csv   – タイトル、ISSN、オープンアクセスのポリシーを含

    む   – 項目数は多いが、埋まっていないジャーナルが 多い   •  誰でも入手可能。ライセンスはCC-­‐BY-­‐SA
  3. KBART •  NISOとUKSGによって策定された、ナレッジ ベース向けのデータ交換フォーマット   •  タイトル、ISSN、URL、オンラインで利用できる 最初の号と最後の号などを含む   • 

    TSV形式で公開   •  多くの(海外の学術系)出版社がKBARTで ジャーナルリストを公開している   – h@ps://sites.google.com/site/kbartregistry/  
  4. (番外)COUNTER •  電子リソースの利用統計   – h@p://www.projectcounter.org   – 電子ジャーナル・電子ブック・データベースなど、 資料種別ごとにいくつかの種類がある   • 

    XMLファイル、もしくはTSVファイルで提供   •  タイトル、ISSN、DOI、ダウンロード数、アクセ ス拒否回数などを含む   •  通常は電子ジャーナルの契約者(図書館)   のみに提供される
  5. (番外)Journal  CitaOon  Reports •  Thomsonの提供する商用の文献引用データ ベース   – h@p://about.jcr.incites.thomsonreuters.com   • 

    タイトル、引用回数、被引用回数、インパクト ファクター、ISSNなどを含む   •  JCRからPDF・Excel・CSVファイルで提供  
  6. これらのファイルでできること •  タイトルの文字列   •  ISSN   •  契約価格  

    •  ダウンロード数   •  オープンアクセス   •  研究分野   •  SNIP,  インパクトファクター   •  以上を全てかけあわせた検索  
  7. 用意するもの •  Ruby   •  SQLite3   –  SQLデータベース  

    •  ElasOcsearch   –  全文検索エンジン。CiNii  DissertaOonsでも使用。   動作にJavaが必要   •  CSV/TSVファイルを開けるソフトウェア   –  LibreOffice,  Microsof  Excel,  その他テキストエディタ   •  今まで紹介してきたジャーナルリストのファイル
  8. ElasOcsearchでデータを検索   できるようにする •  ElasOcsearchのCSVプラグインを使用   – h@ps://github.com/AgileWorksOrg/elasOcsearch-­‐ river-­‐csv   – CSV・TSVファイルを使って検索インデックスを作成

      •  同様に管理用プラグインをインストールし、   検索フォームを使用できるようにする   – h@ps://github.com/mobz/elasOcsearch-­‐head  
  9. 今後の課題(1) •  ジャーナルの名寄せの問題   – 複数のISSN(Print  ISSN,  Online  ISSN,  ISSN-­‐L)  

    •  対策:  外部のナレッジベースを使う   – GOKbはPrint版とOnline版で共通のジャーナル ID(GOKb  idenOfier)を付与している   – h@p://gokb.kuali.org/gokb/   – データのライセンスはCC0、WebAPIも公開  
  10. GOKb  idenOfierの取得 •  ElasOcsearchへの投入時にGOKbのWebAPIを   使用してGOKb  idenOfierを取得する   •  h@p://gokb.kuali.org/gokb/coreference/index?

    nspart=issn&idpart=1468-­‐6996   •  Paper  ISSNを用いてGOKb  idenOfierやOnline  ISSNを問い合 わせる例   GOKb  idenOfier 他のID(ISSNなど)
  11. ORCIDを用いた   ジャーナル利用統計(案) •  論文のDOIをCrossRefで検索し、その論文   著者のORCIDを取得   •  ORCID

     APIを用いて研究者のプロフィール   情報を取得   – 所属、研究分野、論文以外の実績   (特許、ソフトウェアなど)   •  ジャーナルの利用状況と発表成果の情報を かけあわせた統計の作成が可能に
  12. おわりに •  まずLibreOfficeをインストールしてみましょう   – h@ps://ja.libreoffice.org   – フリーウェア   – TSVもExcelファイルもダブルクリックで開けます  

    – ExcelはUTF-­‐8のTSVファイルを扱うのが難しいです   •  ふだん使用するExcelファイルを、できる限り TSV形式で保存してみましょう  
  13. もっとTSV! •  どんな環境でも使える、長期間の活用に   堪えうるデータフォーマットとして   •  プログラムで簡単に扱える、データ分析や   業務効率化に適したデータフォーマットとして

      •  「Open  Data」「Open  Science」で図書館に期待 される役割を果たすためのひとつの要素と   して   •  まずジャーナルリストをTSVにしてみませんか