学術情報XML推進協議会セミナー 日時 :2020年8月8日(火曜日)17:00 – 17:30 場所:アルカディア市ヶ谷(私学会館)
J-STAGEおよびJxivの現況令和5年8月8日情報基盤事業部
View Slide
J-STAGE / J-STAGE Dataトピック①2
基本データ(2022年度末時点)• 登載資料数:3,756誌• 登載記事数:5,533,780件• 発行機関数:2,225機関J-STAGE:日本の科学技術刊行物を公開するプラットフォーム3• 登載データ数:493件• 利用申請機関数:75誌(うち、データ登載済み機関:33誌)J-STAGE Data:J-STAGE登載記事関連データを公開するリポジトリ
過去1年間の取組(2022/8~2023/7)①システム関係(J-STAGEのみ)• 2022年12月リリース– Graphical abstract表示追加対応…巻号一覧画面にGraphical abstractが表示されるようになりました。• 2023年1月リリース– 編集登載システムのデータチェック機能が強化されました。• 2023年4月リリース– 筆頭著者や最終著者、連絡著者が複数設定できるようになりました。– 識別子情報の検索拡充…著者所属情報・助成機関情報の識別子で検索可能になりました。4
過去1年間の取組(2022/8~2023/7)②サービス関係(J-STAGE、J-STAGE Data)• ジャーナルコンサルティング…2022年度は18誌が参加、2023年度のプロジェクトは15誌採択し進行中• J-STAGEセミナー…2022年度テーマ「オープンサイエンスの進展による研究データの共有・利活用の取り組み」• J-STAGEニュース…No. 51• J-STAGE Data利用促進の取組…説明会、トレーニングなど• J-STAGE Dataユーザミーティング• ジャーナルコンサルティング 実践セミナー・基礎セミナー5
2023年度の取組予定①システム関係• J-STAGEバーチャルイシュー機能②サービス関係• 編集登載システムの各種機能に関するオンライン講習会の開催• J-STAGEセミナー…2023年度第1回セミナーテーマ「国内外の動向を踏まえたジャーナルのオープンアクセス化」• ジャーナル・インパクトファクター取得にむけたセミナー(9月予定)6
XML関連のトピック7カレント誌に占める全文XML登載誌数の割合:2%全文XML作成ツールリリース(2020年)JATS1.1へのバージョンアップ(2019年)892945 985 9971,3211,6812,1782,4972,6622,9193,1561172293854545769651,0871,5021,5851,7181,84720 32 34 37 45 63 75 109 119 148 16105001,0001,5002,0002,5003,0003,5001 2 3 4 5 6 7 8 9 10 11XML形式利用誌数の推移系列1 系列2 系列3カレント誌に占める全文XML登載誌数の割合:5%+12 +2 +3 +8 +18 +12 +34 +10 +29全文XML新規導入誌数→+13
J-STAGE登載誌の全文XML化が進まない根本原因を考える令和3年度J-STAGE利用者満足度調査の回答81, 49%2, 24%3, 27%問16. 貴誌の全文XMLの利用状況および移行予定を選んでください。【単一回答】N=413問17. 全文XMLへの移行を考えていない理由を選んでください。【複数回答可】N=203全文XMLデータを作成するコストが高い:40誌全文はPDF形式の公開で十分と考えている:119誌全文XML形式の利点がよくわからない:68誌822161214219その他20誌
J-STAGE登載誌の全文XML化が進まない根本原因を考える海外大手出版社のようにはいかないのか?9原稿受理 全文XML化 公開海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコストが高い」という問題は発生しない学協会側の全文XML化に対する理解にかかわらずデフォルトで作業フローに組み込まれている全文XML化による付加価値が著者・研究者へ還元されている• 原稿はすべて出版社側で全文XML化• オフショアで作業しておりスケールメリットが生じる• すべての論文がHTMLで全文閲覧可能• テキストデータマイニング(TDM)による検索ソリューションを提供学協会で追加コストを払う必要が無い参考:http://tokizane.jp/Ref/TokiPDF/Tokizane-TeX-20121027.pdfhttps://www.springernature.com/jp/landing/text-and-data-mining
J-STAGE登載誌の全文XML化が進まない根本原因を考える海外大手出版社のようにはいかないのか?10原稿受理 全文XML化 公開海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコストが高い」という問題は発生しない学協会側の全文XML化に対する理解にかかわらずデフォルトで作業フローに組み込まれている全文XML化による付加価値が著者・研究者へ還元されている• 原稿はすべて出版社側で全文XML化• オフショアで作業しておりスケールメリットが生じる学協会で追加コストを払う必要が無いJ-STAGE登載時に自動で全文XML化されるような仕組み……?• すべての論文がHTMLで全文閲覧可能• テキストデータマイニング(TDM)による検索ソリューションを提供
J-STAGE登載誌の全文XML化が進まない根本原因を考える海外大手出版社のようにはいかないのか?11原稿受理 全文XML化 公開海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコストが高い」という問題は発生しない学協会側の全文XML化に対する理解にかかわらずデフォルトで作業フローに組み込まれている全文XML化による付加価値が著者・研究者へ還元されている• 原稿はすべて出版社側で全文XML化• オフショアで作業しておりスケールメリットが生じる学協会で追加コストを払う必要が無いJ-STAGE登載時に自動で全文XML化されるような仕組み……?学協会が低コストでXMLデータを作成できるような支援全文XML化による付加価値を理解してもらう• すべての論文がHTMLで全文閲覧可能• テキストデータマイニング(TDM)による検索ソリューションを提供
全文XML作成ツールに関する直近の取組• 2022年3月の改修により操作性や作業効率を改善(下図参照)• 利用促進支援の準備中…講習会開催、操作概要動画の改訂など12改修前:XMLエディタによる編集のみ改修後:複数原稿の一括変換、GUIで編集、PDF自動生成• J-STAGEにおいても、書誌XMLで登載した記事を全文XMLで登載しなおせるよう対応(履歴なし記事訂正扱い)
Jxiv (ジェイカイブ):JSTのプレプリントサーバトピック②13
プレプリントとは何か• 医学系のプレプリントサーバでCOVID-19関連の研究が迅速に公開されたことでCOVID-19感染対策が躍進、プレプリントという公開形態に注目が集まる14• プレプリント:査読を経ずに成果を公開することで研究サイクルの加速を図る、研究成果流通の手段の一つ• プレプリントサーバ(プレプリントをインターネット上で公開するウェブサイト):物理学・数学分野などのプレプリントを公開するarXiv(1991年設立)が発祥
Jxiv立ち上げの背景15小柴等, 林和弘,伊藤裕子 (2020) http://doi.org/10.15108/dp186西川開 (2022) https://doi.org/10.15108/dp204COVID-19関連のプレプリントの投稿元の国別内訳• 海外諸国と比較して日本からのプレプリントの公開は少ない→研究サイクルが他国より遅れる→研究の先取権争いで日本の研究者が不利になる などの懸念• 日本の研究者の間でプレプリントの利用が広がらない原因– 必要性を感じない– 適当な分野のサーバが見つからない、など日本の研究者が利用しやすいプレプリントサーバの構築
Jxivの特徴16トップ画面 (https://jxiv.jst.go.jp/)
Jxivの特徴17書誌画面本文PDF
Jxivの特徴• 対象分野:すべて(自然科学、人文・社会科学の既存の枠組みを超えて、学際的な内容も取り扱う)• 対象言語:日本語、英語• 投稿にはresearchmap IDまたはORCID IDが必要• 投稿から公開までのフロー:右図参照(他のサーバとほぼ同じ)• PKP*1のOPS*2をベースにカスタマイズして開発18*1 Public Knowledge Project:学術出版の質の向上を目的にオープンソースソフトウェアの開発・研究を行う、複数の大学による国際的なイニシアチブ*2 Open Preprint Systems:オープンソースのプレプリントサーバシステム
Jxivに関する反響• Jxiv運用開始後のTwitter上の反応(要約)– 肯定的な意見「日本語で投稿できるのはよい」「国内で運営されていると安心」– 否定的な意見「既存のサーバが確立されているので不要」「利用が広がるかどうか疑問」• 各種メディアでの報道– 2022/5/15 日本経済新聞「査読前論文、日本から発信 JST、投稿サイトを開設」– 2022/6/6 Nature“Japan launches preprint server — but will scientists use it?”– 2023/6/12 Scholarly Kitchen“A Year of Jxiv – Warming the Preprints Stone”– その他、国内の科学系情報誌でも複数誌に取り上げられる19
Jxivの運用状況• 特定の分野に偏り過ぎず幅広く投稿がある• 公開数ゼロの分野もある• 学際系や人社系は日本語での投稿が多い傾向20分野生物学・生命科学・基礎医学農学・食品科学情報科学環境学学際科学哲学・宗教人類学・史学・地理学文学・言語学・芸術学法学・政治学経済学・経営学社会学心理学・教育学英 35 4 7 2 0 0 0 2 0 1 2 2日 10 6 14 1 7 1 1 5 5 26 2 7分野数学物理学化学地球科学・天文学 一般医学・社会医学・看護学歯学薬学臨床医学一般工学・総合工学ナノ・材料科学建築学・土木工学 機械工学電気電子工学英 5 5 1 9 12 2 0 1 3 5 4 8 0日 0 7 6 3 3 0 0 0 4 2 3 0 0• 公開記事の分野別・言語別内訳(2023年8月3日時点)• 総公開記事数:223• 総ダウンロード数:138,884
Jxivの今後の課題• 国内学協会(主にJ-STAGE登載誌)との連携強化– プレプリントとして公開した内容の扱いについて、「既知の内容」とする(=投稿を受け付けない)、もしくは規定の無いジャーナルが多い→説明会を開催し、投稿規程の改訂を検討するよう呼びかけ→Jxivへの投稿を推奨しているジャーナルのリストをJxivのウェブサイトに掲示して相互発展を見込む(6月末時点で75誌)https://jxiv.jst.go.jp/index.php/jxiv/announcement/view/4• 機能強化• 運営体制の最適化21
プレプリントとXMLの関係• プレプリント界隈における全文XML化の動きは極めて小さい– Jxiv含め、多くのプレプリントサーバは全文HTML表示ができない…ベースシステムが対応していないため(関連データとしてXMLファイルの添付は可)• 特殊な例:bioRxivとmedRxivはHTMLで全文閲覧が可能– いずれもCold Spring Harbor Laboratoryが運営、HighWire社が開発– 受理されたプレプリントはXML変換処理にかけられ、PDF公開から2日ほど経って全文HTMLが公開される• プレプリントの全文XML化における第一の課題は、ベースシステム側が(必要性を認識して)全文XMLに対応できる環境を整備するところにある22
ご静聴ありがとうございました23