$30 off During Our Annual Pro Sale. View Details »

J-STAGEおよびJxivの現況

XSPA
August 08, 2023

 J-STAGEおよびJxivの現況

学術情報XML推進協議会セミナー
日時 :2020年8月8日(火曜日)17:00 – 17:30
場所:アルカディア市ヶ谷(私学会館) 

XSPA

August 08, 2023
Tweet

More Decks by XSPA

Other Decks in Technology

Transcript

  1. J-STAGEおよびJxivの現況
    令和5年8月8日
    情報基盤事業部

    View Slide

  2. J-STAGE / J-STAGE Data
    トピック①
    2

    View Slide

  3. 基本データ(2022年度末時点)
    • 登載資料数:3,756誌
    • 登載記事数:5,533,780件
    • 発行機関数:2,225機関
    J-STAGE:日本の科学技術刊行物を公開するプラットフォーム
    3
    • 登載データ数:493件
    • 利用申請機関数:75誌(うち、データ登載済み機関:33誌)
    J-STAGE Data:J-STAGE登載記事関連データを公開するリポジトリ

    View Slide

  4. 過去1年間の取組(2022/8~2023/7)
    ①システム関係(J-STAGEのみ)
    • 2022年12月リリース
    – Graphical abstract表示追加対応…巻号一覧画面にGraphical abstract
    が表示されるようになりました。
    • 2023年1月リリース
    – 編集登載システムのデータチェック機能が強化されました。
    • 2023年4月リリース
    – 筆頭著者や最終著者、連絡著者が複数設定できるようになりました。
    – 識別子情報の検索拡充…著者所属情報・助成機関情報の識別子で検
    索可能になりました。
    4

    View Slide

  5. 過去1年間の取組(2022/8~2023/7)
    ②サービス関係(J-STAGE、J-STAGE Data)
    • ジャーナルコンサルティング…2022年度は18誌が参加、2023年度のプロ
    ジェクトは15誌採択し進行中
    • J-STAGEセミナー…2022年度テーマ「オープンサイエンスの進展による研
    究データの共有・利活用の取り組み」
    • J-STAGEニュース…No. 51
    • J-STAGE Data利用促進の取組…説明会、トレーニングなど
    • J-STAGE Dataユーザミーティング
    • ジャーナルコンサルティング 実践セミナー・基礎セミナー
    5

    View Slide

  6. 2023年度の取組予定
    ①システム関係
    • J-STAGEバーチャルイシュー機能
    ②サービス関係
    • 編集登載システムの各種機能に関するオンライン講習会の開催
    • J-STAGEセミナー…2023年度第1回セミナーテーマ「国内外の動向を踏まえ
    たジャーナルのオープンアクセス化」
    • ジャーナル・インパクトファクター取得にむけたセミナー(9月予定)
    6

    View Slide

  7. XML関連のトピック
    7
    カレント誌に占める
    全文XML登載誌数の
    割合:2%
    全文XML作成ツール
    リリース(2020年)
    JATS1.1へのバージョン
    アップ(2019年)
    892
    945 985 997
    1,321
    1,681
    2,178
    2,497
    2,662
    2,919
    3,156
    117
    229
    385
    454
    576
    965
    1,087
    1,502
    1,585
    1,718
    1,847
    20 32 34 37 45 63 75 109 119 148 161
    0
    500
    1,000
    1,500
    2,000
    2,500
    3,000
    3,500
    1 2 3 4 5 6 7 8 9 10 11
    XML形式利用誌数の推移
    系列1 系列2 系列3
    カレント誌に占める全文
    XML登載誌数の割合:5%
    +12 +2 +3 +8 +18 +12 +34 +10 +29
    全文XML新規導入誌数→
    +13

    View Slide

  8. J-STAGE登載誌の全文XML化が進まない根本原因を考える
    令和3年度J-STAGE利用者満足度調査の回答
    8
    1, 49%
    2, 24%
    3, 27%
    問16. 貴誌の全文XMLの利用状況および
    移行予定を選んでください。【単一回答】
    N=413
    問17. 全文XMLへの移行を考えていない
    理由を選んでください。【複数回答可】
    N=203
    全文XMLデータを
    作成するコストが
    高い:40誌
    全文はPDF形式の公開
    で十分と考えている:
    119誌
    全文XML形式の利点が
    よくわからない:68誌
    82
    21
    6
    12
    1
    42
    19
    その他
    20誌

    View Slide

  9. J-STAGE登載誌の全文XML化が進まない根本原因を考える
    海外大手出版社のようにはいかないのか?
    9
    原稿受理 全文XML化 公開
    海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト
    が高い」という問題は発生しない
    学協会側の全文XML化に
    対する理解にかかわらず
    デフォルトで作業フローに
    組み込まれている
    全文XML化による付加価値が
    著者・研究者へ還元されている
    • 原稿はすべて出版社側で
    全文XML化
    • オフショアで作業しており
    スケールメリットが生じる
    • すべての論文がHTMLで
    全文閲覧可能
    • テキストデータマイニング
    (TDM)による検索ソリュー
    ションを提供
    学協会で追加コストを
    払う必要が無い
    参考:
    http://tokizane.jp/Ref/TokiPDF/Tokizane-TeX-20121027.pdf
    https://www.springernature.com/jp/landing/text-and-data-mining

    View Slide

  10. J-STAGE登載誌の全文XML化が進まない根本原因を考える
    海外大手出版社のようにはいかないのか?
    10
    原稿受理 全文XML化 公開
    海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト
    が高い」という問題は発生しない
    学協会側の全文XML化に
    対する理解にかかわらず
    デフォルトで作業フローに
    組み込まれている
    全文XML化による付加価値が
    著者・研究者へ還元されている
    • 原稿はすべて出版社側で
    全文XML化
    • オフショアで作業しており
    スケールメリットが生じる
    学協会で追加コストを
    払う必要が無い
    J-STAGE登載時に自動で
    全文XML化されるような
    仕組み……?
    • すべての論文がHTMLで
    全文閲覧可能
    • テキストデータマイニング
    (TDM)による検索ソリュー
    ションを提供

    View Slide

  11. J-STAGE登載誌の全文XML化が進まない根本原因を考える
    海外大手出版社のようにはいかないのか?
    11
    原稿受理 全文XML化 公開
    海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト
    が高い」という問題は発生しない
    学協会側の全文XML化に
    対する理解にかかわらず
    デフォルトで作業フローに
    組み込まれている
    全文XML化による付加価値が
    著者・研究者へ還元されている
    • 原稿はすべて出版社側で
    全文XML化
    • オフショアで作業しており
    スケールメリットが生じる
    学協会で追加コストを
    払う必要が無い
    J-STAGE登載時に自動で
    全文XML化されるような
    仕組み……?
    学協会が低コストで
    XMLデータを作成
    できるような支援
    全文XML化による付加価値を
    理解してもらう
    • すべての論文がHTMLで
    全文閲覧可能
    • テキストデータマイニング
    (TDM)による検索ソリュー
    ションを提供

    View Slide

  12. 全文XML作成ツールに関する直近の取組
    • 2022年3月の改修により操作性や作業効率を改善(下図参照)
    • 利用促進支援の準備中…講習会開催、操作概要動画の改訂など
    12
    改修前:XMLエディタによる編集のみ
    改修後:複数原稿の一括変換、GUIで編集、PDF自動生成
    • J-STAGEにおいても、書誌XMLで登載した
    記事を全文XMLで登載しなおせるよう対応
    (履歴なし記事訂正扱い)

    View Slide

  13. Jxiv (ジェイカイブ):
    JSTのプレプリントサーバ
    トピック②
    13

    View Slide

  14. プレプリントとは何か
    • 医学系のプレプリントサーバ
    でCOVID-19関連の研究が
    迅速に公開されたことで
    COVID-19感染対策が躍進、
    プレプリントという公開形態
    に注目が集まる
    14
    • プレプリント:査読を経ずに成果を公開することで研究サイクルの加速を図る、研究
    成果流通の手段の一つ
    • プレプリントサーバ(プレプリントをインターネット上で公開するウェブサイト):物理
    学・数学分野などのプレプリントを公開するarXiv(1991年設立)が発祥

    View Slide

  15. Jxiv立ち上げの背景
    15
    小柴等, 林和弘,伊藤裕子 (2020) http://doi.org/10.15108/dp186
    西川開 (2022) https://doi.org/10.15108/dp204
    COVID-19関連のプレプリントの投稿元の国別内訳
    • 海外諸国と比較して日本からのプレプ
    リントの公開は少ない
    →研究サイクルが他国より遅れる
    →研究の先取権争いで日本の研究者
    が不利になる などの懸念
    • 日本の研究者の間でプレプリントの利
    用が広がらない原因
    – 必要性を感じない
    – 適当な分野のサーバが見つ
    からない、など
    日本の研究者が利用しやすい
    プレプリントサーバの構築

    View Slide

  16. Jxivの特徴
    16
    トップ画面 (https://jxiv.jst.go.jp/)

    View Slide

  17. Jxivの特徴
    17
    書誌画面
    本文PDF

    View Slide

  18. Jxivの特徴
    • 対象分野:すべて(自然科学、人文・
    社会科学の既存の枠組みを超えて、
    学際的な内容も取り扱う)
    • 対象言語:日本語、英語
    • 投稿にはresearchmap IDまたは
    ORCID IDが必要
    • 投稿から公開までのフロー:右図参
    照(他のサーバとほぼ同じ)
    • PKP*1のOPS*2をベースにカスタマイ
    ズして開発
    18
    *1 Public Knowledge Project:学術出版の質の向上
    を目的にオープンソースソフトウェアの開発・研究を
    行う、複数の大学による国際的なイニシアチブ
    *2 Open Preprint Systems:オープンソースのプレプ
    リントサーバシステム

    View Slide

  19. Jxivに関する反響
    • Jxiv運用開始後のTwitter上の反応(要約)
    – 肯定的な意見
    「日本語で投稿できるのはよい」「国内で運営されていると安心」
    – 否定的な意見
    「既存のサーバが確立されているので不要」「利用が広がるかどうか疑問」
    • 各種メディアでの報道
    – 2022/5/15 日本経済新聞
    「査読前論文、日本から発信 JST、投稿サイトを開設」
    – 2022/6/6 Nature
    “Japan launches preprint server — but will scientists use it?”
    – 2023/6/12 Scholarly Kitchen
    “A Year of Jxiv – Warming the Preprints Stone”
    – その他、国内の科学系情報誌でも複数誌に取り上げられる
    19

    View Slide

  20. Jxivの運用状況
    • 特定の分野に偏り過ぎず
    幅広く投稿がある
    • 公開数ゼロの分野もある
    • 学際系や人社系は日本語
    での投稿が多い傾向
    20

















































































    英 35 4 7 2 0 0 0 2 0 1 2 2
    日 10 6 14 1 7 1 1 5 5 26 2 7
















    学 一











































    学 機









    英 5 5 1 9 12 2 0 1 3 5 4 8 0
    日 0 7 6 3 3 0 0 0 4 2 3 0 0
    • 公開記事の分野別・言語別内訳(2023年8月3日時点)
    • 総公開記事数:223
    • 総ダウンロード数:
    138,884

    View Slide

  21. Jxivの今後の課題
    • 国内学協会(主にJ-STAGE登載誌)との連携強化
    – プレプリントとして公開した内容の扱いについて、「既知の内容」とする
    (=投稿を受け付けない)、もしくは規定の無いジャーナルが多い
    →説明会を開催し、投稿規程の改訂を検討するよう呼びかけ
    →Jxivへの投稿を推奨しているジャーナルのリストをJxivのウェブサイト
    に掲示して相互発展を見込む(6月末時点で75誌)
    https://jxiv.jst.go.jp/index.php/jxiv/announcement/view/4
    • 機能強化
    • 運営体制の最適化
    21

    View Slide

  22. プレプリントとXMLの関係
    • プレプリント界隈における全文XML化の動きは極めて小さい
    – Jxiv含め、多くのプレプリントサーバは全文HTML表示ができない…ベースシステ
    ムが対応していないため(関連データとしてXMLファイルの添付は可)
    • 特殊な例:bioRxivとmedRxivはHTMLで全文閲覧が可能
    – いずれもCold Spring Harbor Laboratoryが運営、HighWire社が開発
    – 受理されたプレプリントはXML変換処理にかけられ、PDF公開から2日ほど経っ
    て全文HTMLが公開される
    • プレプリントの全文XML化における第一の課題は、ベースシステム側が(必
    要性を認識して)全文XMLに対応できる環境を整備するところにある
    22

    View Slide

  23. ご静聴ありがとうございました
    23

    View Slide