Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
J-STAGEおよびJxivの現況
Search
XSPA
August 08, 2023
Technology
0
170
J-STAGEおよびJxivの現況
学術情報XML推進協議会セミナー
日時 :2020年8月8日(火曜日)17:00 – 17:30
場所:アルカディア市ヶ谷(私学会館)
XSPA
August 08, 2023
Tweet
Share
More Decks by XSPA
See All by XSPA
Chat GPTによるXML自動生成の可能性
xspa2012
0
260
デジタルアーカイブとしての電子ジャーナル
xspa2012
0
55
日本のデジタル辞書を支えるXMLフォーマット"LeXML"
xspa2012
0
380
全文XML作成ツールの感想
xspa2012
0
330
全文 XML 作成ツールについて
xspa2012
0
320
InDesignからのXML書き出し
xspa2012
0
760
oXygenによる作成技法
xspa2012
0
200
学術情報を結びつ ける識別子
xspa2012
1
110
Text Encoding Initiative のご紹介/ 20190802-xml-nagasaki
xspa2012
0
140
Other Decks in Technology
See All in Technology
プロダクト開発を加速させるためのQA文化の築き方 / How to build QA culture to accelerate product development
mii3king
1
260
AIのコンプラは何故しんどい?
shujisado
1
190
LINE Developersプロダクト(LIFF/LINE Login)におけるフロントエンド開発
lycorptech_jp
PRO
0
120
podman_update_2024-12
orimanabu
1
260
2024年にチャレンジしたことを振り返るぞ
mitchan
0
130
どちらを使う?GitHub or Azure DevOps Ver. 24H2
kkamegawa
0
620
OpenShift Virtualizationのネットワーク構成を真剣に考えてみた/OpenShift Virtualization's Network Configuration
tnk4on
0
130
あの日俺達が夢見たサーバレスアーキテクチャ/the-serverless-architecture-we-dreamed-of
tomoki10
0
420
watsonx.ai Dojo #5 ファインチューニングとInstructLAB
oniak3ibm
PRO
0
160
Wvlet: A New Flow-Style Query Language For Functional Data Modeling and Interactive Data Analysis - Trino Summit 2024
xerial
1
110
CustomCopを使ってMongoidのコーディングルールを整えてみた
jinoketani
0
220
ずっと昔に Star をつけたはずの思い出せない GitHub リポジトリを見つけたい!
rokuosan
0
150
Featured
See All Featured
Optimizing for Happiness
mojombo
376
70k
VelocityConf: Rendering Performance Case Studies
addyosmani
326
24k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
229
52k
Building Better People: How to give real-time feedback that sticks.
wjessup
365
19k
StorybookのUI Testing Handbookを読んだ
zakiyama
27
5.3k
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
Making Projects Easy
brettharned
116
5.9k
The MySQL Ecosystem @ GitHub 2015
samlambert
250
12k
Building Adaptive Systems
keathley
38
2.3k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
247
1.3M
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
810
Transcript
J-STAGEおよびJxivの現況 令和5年8月8日 情報基盤事業部
J-STAGE / J-STAGE Data トピック① 2
基本データ(2022年度末時点) • 登載資料数:3,756誌 • 登載記事数:5,533,780件 • 発行機関数:2,225機関 J-STAGE:日本の科学技術刊行物を公開するプラットフォーム 3 •
登載データ数:493件 • 利用申請機関数:75誌(うち、データ登載済み機関:33誌) J-STAGE Data:J-STAGE登載記事関連データを公開するリポジトリ
過去1年間の取組(2022/8~2023/7) ①システム関係(J-STAGEのみ) • 2022年12月リリース – Graphical abstract表示追加対応…巻号一覧画面にGraphical abstract が表示されるようになりました。 •
2023年1月リリース – 編集登載システムのデータチェック機能が強化されました。 • 2023年4月リリース – 筆頭著者や最終著者、連絡著者が複数設定できるようになりました。 – 識別子情報の検索拡充…著者所属情報・助成機関情報の識別子で検 索可能になりました。 4
過去1年間の取組(2022/8~2023/7) ②サービス関係(J-STAGE、J-STAGE Data) • ジャーナルコンサルティング…2022年度は18誌が参加、2023年度のプロ ジェクトは15誌採択し進行中 • J-STAGEセミナー…2022年度テーマ「オープンサイエンスの進展による研 究データの共有・利活用の取り組み」 •
J-STAGEニュース…No. 51 • J-STAGE Data利用促進の取組…説明会、トレーニングなど • J-STAGE Dataユーザミーティング • ジャーナルコンサルティング 実践セミナー・基礎セミナー 5
2023年度の取組予定 ①システム関係 • J-STAGEバーチャルイシュー機能 ②サービス関係 • 編集登載システムの各種機能に関するオンライン講習会の開催 • J-STAGEセミナー…2023年度第1回セミナーテーマ「国内外の動向を踏まえ たジャーナルのオープンアクセス化」
• ジャーナル・インパクトファクター取得にむけたセミナー(9月予定) 6
XML関連のトピック 7 カレント誌に占める 全文XML登載誌数の 割合:2% 全文XML作成ツール リリース(2020年) JATS1.1へのバージョン アップ(2019年) 892
945 985 997 1,321 1,681 2,178 2,497 2,662 2,919 3,156 117 229 385 454 576 965 1,087 1,502 1,585 1,718 1,847 20 32 34 37 45 63 75 109 119 148 161 0 500 1,000 1,500 2,000 2,500 3,000 3,500 1 2 3 4 5 6 7 8 9 10 11 XML形式利用誌数の推移 系列1 系列2 系列3 カレント誌に占める全文 XML登載誌数の割合:5% +12 +2 +3 +8 +18 +12 +34 +10 +29 全文XML新規導入誌数→ +13
J-STAGE登載誌の全文XML化が進まない根本原因を考える 令和3年度J-STAGE利用者満足度調査の回答 8 1, 49% 2, 24% 3, 27% 問16.
貴誌の全文XMLの利用状況および 移行予定を選んでください。【単一回答】 N=413 問17. 全文XMLへの移行を考えていない 理由を選んでください。【複数回答可】 N=203 全文XMLデータを 作成するコストが 高い:40誌 全文はPDF形式の公開 で十分と考えている: 119誌 全文XML形式の利点が よくわからない:68誌 82 21 6 12 1 42 19 その他 20誌
J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 9 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず
デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供 学協会で追加コストを 払う必要が無い 参考: http://tokizane.jp/Ref/TokiPDF/Tokizane-TeX-20121027.pdf https://www.springernature.com/jp/landing/text-and-data-mining
J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 10 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず
デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる 学協会で追加コストを 払う必要が無い J-STAGE登載時に自動で 全文XML化されるような 仕組み……? • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供
J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 11 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず
デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる 学協会で追加コストを 払う必要が無い J-STAGE登載時に自動で 全文XML化されるような 仕組み……? 学協会が低コストで XMLデータを作成 できるような支援 全文XML化による付加価値を 理解してもらう • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供
全文XML作成ツールに関する直近の取組 • 2022年3月の改修により操作性や作業効率を改善(下図参照) • 利用促進支援の準備中…講習会開催、操作概要動画の改訂など 12 改修前:XMLエディタによる編集のみ 改修後:複数原稿の一括変換、GUIで編集、PDF自動生成 • J-STAGEにおいても、書誌XMLで登載した
記事を全文XMLで登載しなおせるよう対応 (履歴なし記事訂正扱い)
Jxiv (ジェイカイブ): JSTのプレプリントサーバ トピック② 13
プレプリントとは何か • 医学系のプレプリントサーバ でCOVID-19関連の研究が 迅速に公開されたことで COVID-19感染対策が躍進、 プレプリントという公開形態 に注目が集まる 14 •
プレプリント:査読を経ずに成果を公開することで研究サイクルの加速を図る、研究 成果流通の手段の一つ • プレプリントサーバ(プレプリントをインターネット上で公開するウェブサイト):物理 学・数学分野などのプレプリントを公開するarXiv(1991年設立)が発祥
Jxiv立ち上げの背景 15 小柴等, 林和弘,伊藤裕子 (2020) http://doi.org/10.15108/dp186 西川開 (2022) https://doi.org/10.15108/dp204 COVID-19関連のプレプリントの投稿元の国別内訳
• 海外諸国と比較して日本からのプレプ リントの公開は少ない →研究サイクルが他国より遅れる →研究の先取権争いで日本の研究者 が不利になる などの懸念 • 日本の研究者の間でプレプリントの利 用が広がらない原因 – 必要性を感じない – 適当な分野のサーバが見つ からない、など 日本の研究者が利用しやすい プレプリントサーバの構築
Jxivの特徴 16 トップ画面 (https://jxiv.jst.go.jp/)
Jxivの特徴 17 書誌画面 本文PDF
Jxivの特徴 • 対象分野:すべて(自然科学、人文・ 社会科学の既存の枠組みを超えて、 学際的な内容も取り扱う) • 対象言語:日本語、英語 • 投稿にはresearchmap IDまたは
ORCID IDが必要 • 投稿から公開までのフロー:右図参 照(他のサーバとほぼ同じ) • PKP*1のOPS*2をベースにカスタマイ ズして開発 18 *1 Public Knowledge Project:学術出版の質の向上 を目的にオープンソースソフトウェアの開発・研究を 行う、複数の大学による国際的なイニシアチブ *2 Open Preprint Systems:オープンソースのプレプ リントサーバシステム
Jxivに関する反響 • Jxiv運用開始後のTwitter上の反応(要約) – 肯定的な意見 「日本語で投稿できるのはよい」「国内で運営されていると安心」 – 否定的な意見 「既存のサーバが確立されているので不要」「利用が広がるかどうか疑問」 •
各種メディアでの報道 – 2022/5/15 日本経済新聞 「査読前論文、日本から発信 JST、投稿サイトを開設」 – 2022/6/6 Nature “Japan launches preprint server — but will scientists use it?” – 2023/6/12 Scholarly Kitchen “A Year of Jxiv – Warming the Preprints Stone” – その他、国内の科学系情報誌でも複数誌に取り上げられる 19
Jxivの運用状況 • 特定の分野に偏り過ぎず 幅広く投稿がある • 公開数ゼロの分野もある • 学際系や人社系は日本語 での投稿が多い傾向 20
分 野 生 物 学 ・ 生 命 科 学 ・ 基 礎 医 学 農 学 ・ 食 品 科 学 情 報 科 学 環 境 学 学 際 科 学 哲 学 ・ 宗 教 人 類 学 ・ 史 学 ・ 地 理 学 文 学 ・ 言 語 学 ・ 芸 術 学 法 学 ・ 政 治 学 経 済 学 ・ 経 営 学 社 会 学 心 理 学 ・ 教 育 学 英 35 4 7 2 0 0 0 2 0 1 2 2 日 10 6 14 1 7 1 1 5 5 26 2 7 分 野 数 学 物 理 学 化 学 地 球 科 学 ・ 天 文 学 一 般 医 学 ・ 社 会 医 学 ・ 看 護 学 歯 学 薬 学 臨 床 医 学 一 般 工 学 ・ 総 合 工 学 ナ ノ ・ 材 料 科 学 建 築 学 ・ 土 木 工 学 機 械 工 学 電 気 電 子 工 学 英 5 5 1 9 12 2 0 1 3 5 4 8 0 日 0 7 6 3 3 0 0 0 4 2 3 0 0 • 公開記事の分野別・言語別内訳(2023年8月3日時点) • 総公開記事数:223 • 総ダウンロード数: 138,884
Jxivの今後の課題 • 国内学協会(主にJ-STAGE登載誌)との連携強化 – プレプリントとして公開した内容の扱いについて、「既知の内容」とする (=投稿を受け付けない)、もしくは規定の無いジャーナルが多い →説明会を開催し、投稿規程の改訂を検討するよう呼びかけ →Jxivへの投稿を推奨しているジャーナルのリストをJxivのウェブサイト に掲示して相互発展を見込む(6月末時点で75誌) https://jxiv.jst.go.jp/index.php/jxiv/announcement/view/4
• 機能強化 • 運営体制の最適化 21
プレプリントとXMLの関係 • プレプリント界隈における全文XML化の動きは極めて小さい – Jxiv含め、多くのプレプリントサーバは全文HTML表示ができない…ベースシステ ムが対応していないため(関連データとしてXMLファイルの添付は可) • 特殊な例:bioRxivとmedRxivはHTMLで全文閲覧が可能 – いずれもCold
Spring Harbor Laboratoryが運営、HighWire社が開発 – 受理されたプレプリントはXML変換処理にかけられ、PDF公開から2日ほど経っ て全文HTMLが公開される • プレプリントの全文XML化における第一の課題は、ベースシステム側が(必 要性を認識して)全文XMLに対応できる環境を整備するところにある 22
ご静聴ありがとうございました 23