Upgrade to Pro — share decks privately, control downloads, hide ads and more …

J-STAGEおよびJxivの現況

XSPA
August 08, 2023

 J-STAGEおよびJxivの現況

学術情報XML推進協議会セミナー
日時 :2020年8月8日(火曜日)17:00 – 17:30
場所:アルカディア市ヶ谷(私学会館) 

XSPA

August 08, 2023
Tweet

More Decks by XSPA

Other Decks in Technology

Transcript

  1. 基本データ(2022年度末時点) • 登載資料数:3,756誌 • 登載記事数:5,533,780件 • 発行機関数:2,225機関 J-STAGE:日本の科学技術刊行物を公開するプラットフォーム 3 •

    登載データ数:493件 • 利用申請機関数:75誌(うち、データ登載済み機関:33誌) J-STAGE Data:J-STAGE登載記事関連データを公開するリポジトリ
  2. 過去1年間の取組(2022/8~2023/7) ①システム関係(J-STAGEのみ) • 2022年12月リリース – Graphical abstract表示追加対応…巻号一覧画面にGraphical abstract が表示されるようになりました。 •

    2023年1月リリース – 編集登載システムのデータチェック機能が強化されました。 • 2023年4月リリース – 筆頭著者や最終著者、連絡著者が複数設定できるようになりました。 – 識別子情報の検索拡充…著者所属情報・助成機関情報の識別子で検 索可能になりました。 4
  3. XML関連のトピック 7 カレント誌に占める 全文XML登載誌数の 割合:2% 全文XML作成ツール リリース(2020年) JATS1.1へのバージョン アップ(2019年) 892

    945 985 997 1,321 1,681 2,178 2,497 2,662 2,919 3,156 117 229 385 454 576 965 1,087 1,502 1,585 1,718 1,847 20 32 34 37 45 63 75 109 119 148 161 0 500 1,000 1,500 2,000 2,500 3,000 3,500 1 2 3 4 5 6 7 8 9 10 11 XML形式利用誌数の推移 系列1 系列2 系列3 カレント誌に占める全文 XML登載誌数の割合:5% +12 +2 +3 +8 +18 +12 +34 +10 +29 全文XML新規導入誌数→ +13
  4. J-STAGE登載誌の全文XML化が進まない根本原因を考える 令和3年度J-STAGE利用者満足度調査の回答 8 1, 49% 2, 24% 3, 27% 問16.

    貴誌の全文XMLの利用状況および 移行予定を選んでください。【単一回答】 N=413 問17. 全文XMLへの移行を考えていない 理由を選んでください。【複数回答可】 N=203 全文XMLデータを 作成するコストが 高い:40誌 全文はPDF形式の公開 で十分と考えている: 119誌 全文XML形式の利点が よくわからない:68誌 82 21 6 12 1 42 19 その他 20誌
  5. J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 9 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず

    デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供 学協会で追加コストを 払う必要が無い 参考: http://tokizane.jp/Ref/TokiPDF/Tokizane-TeX-20121027.pdf https://www.springernature.com/jp/landing/text-and-data-mining
  6. J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 10 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず

    デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる 学協会で追加コストを 払う必要が無い J-STAGE登載時に自動で 全文XML化されるような 仕組み……? • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供
  7. J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 11 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず

    デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる 学協会で追加コストを 払う必要が無い J-STAGE登載時に自動で 全文XML化されるような 仕組み……? 学協会が低コストで XMLデータを作成 できるような支援 全文XML化による付加価値を 理解してもらう • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供
  8. プレプリントとは何か • 医学系のプレプリントサーバ でCOVID-19関連の研究が 迅速に公開されたことで COVID-19感染対策が躍進、 プレプリントという公開形態 に注目が集まる 14 •

    プレプリント:査読を経ずに成果を公開することで研究サイクルの加速を図る、研究 成果流通の手段の一つ • プレプリントサーバ(プレプリントをインターネット上で公開するウェブサイト):物理 学・数学分野などのプレプリントを公開するarXiv(1991年設立)が発祥
  9. Jxiv立ち上げの背景 15 小柴等, 林和弘,伊藤裕子 (2020) http://doi.org/10.15108/dp186 西川開 (2022) https://doi.org/10.15108/dp204 COVID-19関連のプレプリントの投稿元の国別内訳

    • 海外諸国と比較して日本からのプレプ リントの公開は少ない →研究サイクルが他国より遅れる →研究の先取権争いで日本の研究者 が不利になる などの懸念 • 日本の研究者の間でプレプリントの利 用が広がらない原因 – 必要性を感じない – 適当な分野のサーバが見つ からない、など 日本の研究者が利用しやすい プレプリントサーバの構築
  10. Jxivの特徴 • 対象分野:すべて(自然科学、人文・ 社会科学の既存の枠組みを超えて、 学際的な内容も取り扱う) • 対象言語:日本語、英語 • 投稿にはresearchmap IDまたは

    ORCID IDが必要 • 投稿から公開までのフロー:右図参 照(他のサーバとほぼ同じ) • PKP*1のOPS*2をベースにカスタマイ ズして開発 18 *1 Public Knowledge Project:学術出版の質の向上 を目的にオープンソースソフトウェアの開発・研究を 行う、複数の大学による国際的なイニシアチブ *2 Open Preprint Systems:オープンソースのプレプ リントサーバシステム
  11. Jxivに関する反響 • Jxiv運用開始後のTwitter上の反応(要約) – 肯定的な意見 「日本語で投稿できるのはよい」「国内で運営されていると安心」 – 否定的な意見 「既存のサーバが確立されているので不要」「利用が広がるかどうか疑問」 •

    各種メディアでの報道 – 2022/5/15 日本経済新聞 「査読前論文、日本から発信 JST、投稿サイトを開設」 – 2022/6/6 Nature “Japan launches preprint server — but will scientists use it?” – 2023/6/12 Scholarly Kitchen “A Year of Jxiv – Warming the Preprints Stone” – その他、国内の科学系情報誌でも複数誌に取り上げられる 19
  12. Jxivの運用状況 • 特定の分野に偏り過ぎず 幅広く投稿がある • 公開数ゼロの分野もある • 学際系や人社系は日本語 での投稿が多い傾向 20

    分 野 生 物 学 ・ 生 命 科 学 ・ 基 礎 医 学 農 学 ・ 食 品 科 学 情 報 科 学 環 境 学 学 際 科 学 哲 学 ・ 宗 教 人 類 学 ・ 史 学 ・ 地 理 学 文 学 ・ 言 語 学 ・ 芸 術 学 法 学 ・ 政 治 学 経 済 学 ・ 経 営 学 社 会 学 心 理 学 ・ 教 育 学 英 35 4 7 2 0 0 0 2 0 1 2 2 日 10 6 14 1 7 1 1 5 5 26 2 7 分 野 数 学 物 理 学 化 学 地 球 科 学 ・ 天 文 学 一 般 医 学 ・ 社 会 医 学 ・ 看 護 学 歯 学 薬 学 臨 床 医 学 一 般 工 学 ・ 総 合 工 学 ナ ノ ・ 材 料 科 学 建 築 学 ・ 土 木 工 学 機 械 工 学 電 気 電 子 工 学 英 5 5 1 9 12 2 0 1 3 5 4 8 0 日 0 7 6 3 3 0 0 0 4 2 3 0 0 • 公開記事の分野別・言語別内訳(2023年8月3日時点) • 総公開記事数:223 • 総ダウンロード数: 138,884
  13. プレプリントとXMLの関係 • プレプリント界隈における全文XML化の動きは極めて小さい – Jxiv含め、多くのプレプリントサーバは全文HTML表示ができない…ベースシステ ムが対応していないため(関連データとしてXMLファイルの添付は可) • 特殊な例:bioRxivとmedRxivはHTMLで全文閲覧が可能 – いずれもCold

    Spring Harbor Laboratoryが運営、HighWire社が開発 – 受理されたプレプリントはXML変換処理にかけられ、PDF公開から2日ほど経っ て全文HTMLが公開される • プレプリントの全文XML化における第一の課題は、ベースシステム側が(必 要性を認識して)全文XMLに対応できる環境を整備するところにある 22