Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
J-STAGEおよびJxivの現況
Search
XSPA
August 08, 2023
Technology
0
180
J-STAGEおよびJxivの現況
学術情報XML推進協議会セミナー
日時 :2020年8月8日(火曜日)17:00 – 17:30
場所:アルカディア市ヶ谷(私学会館)
XSPA
August 08, 2023
Tweet
Share
More Decks by XSPA
See All by XSPA
Chat GPTによるXML自動生成の可能性
xspa2012
0
270
デジタルアーカイブとしての電子ジャーナル
xspa2012
0
60
日本のデジタル辞書を支えるXMLフォーマット"LeXML"
xspa2012
0
390
全文XML作成ツールの感想
xspa2012
0
330
全文 XML 作成ツールについて
xspa2012
0
340
InDesignからのXML書き出し
xspa2012
0
780
oXygenによる作成技法
xspa2012
0
210
学術情報を結びつ ける識別子
xspa2012
1
110
Text Encoding Initiative のご紹介/ 20190802-xml-nagasaki
xspa2012
0
140
Other Decks in Technology
See All in Technology
I could be Wrong!! - Learning from Agile Experts
kawaguti
PRO
8
3.4k
Building Scalable Backend Services with Firebase
wisdommatt
0
110
「隙間家具OSS」に至る道/Fujiwara Tech Conference 2025
fujiwara3
7
6.4k
2025年の挑戦 コーポレートエンジニアの技術広報/techpr5
nishiuma
0
140
Kotlin Multiplatformのポテンシャル
recruitengineers
PRO
2
150
なぜfreeeはハブ・アンド・スポーク型の データメッシュアーキテクチャにチャレンジするのか?
shinichiro_joya
2
450
re:Invent2024 KeynoteのAmazon Q Developer考察
yusukeshimizu
1
150
AWS re:Invent 2024 recap in 20min / JAWSUG 千葉 2025.1.14
shimy
1
100
[IBM TechXchange Dojo]Watson Discoveryとwatsonx.aiでRAGを実現!座学①
siyuanzh09
0
110
技術に触れたり、顔を出そう
maruto
1
150
今年一年で頑張ること / What I will do my best this year
pauli
1
220
When Windows Meets Kubernetes…
pichuang
0
300
Featured
See All Featured
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
6
500
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
RailsConf 2023
tenderlove
29
970
[RailsConf 2023] Rails as a piece of cake
palkan
53
5.1k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
7k
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
28
4.5k
Six Lessons from altMBA
skipperchong
27
3.6k
BBQ
matthewcrist
85
9.4k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
192
16k
Scaling GitHub
holman
459
140k
Writing Fast Ruby
sferik
628
61k
Being A Developer After 40
akosma
89
590k
Transcript
J-STAGEおよびJxivの現況 令和5年8月8日 情報基盤事業部
J-STAGE / J-STAGE Data トピック① 2
基本データ(2022年度末時点) • 登載資料数:3,756誌 • 登載記事数:5,533,780件 • 発行機関数:2,225機関 J-STAGE:日本の科学技術刊行物を公開するプラットフォーム 3 •
登載データ数:493件 • 利用申請機関数:75誌(うち、データ登載済み機関:33誌) J-STAGE Data:J-STAGE登載記事関連データを公開するリポジトリ
過去1年間の取組(2022/8~2023/7) ①システム関係(J-STAGEのみ) • 2022年12月リリース – Graphical abstract表示追加対応…巻号一覧画面にGraphical abstract が表示されるようになりました。 •
2023年1月リリース – 編集登載システムのデータチェック機能が強化されました。 • 2023年4月リリース – 筆頭著者や最終著者、連絡著者が複数設定できるようになりました。 – 識別子情報の検索拡充…著者所属情報・助成機関情報の識別子で検 索可能になりました。 4
過去1年間の取組(2022/8~2023/7) ②サービス関係(J-STAGE、J-STAGE Data) • ジャーナルコンサルティング…2022年度は18誌が参加、2023年度のプロ ジェクトは15誌採択し進行中 • J-STAGEセミナー…2022年度テーマ「オープンサイエンスの進展による研 究データの共有・利活用の取り組み」 •
J-STAGEニュース…No. 51 • J-STAGE Data利用促進の取組…説明会、トレーニングなど • J-STAGE Dataユーザミーティング • ジャーナルコンサルティング 実践セミナー・基礎セミナー 5
2023年度の取組予定 ①システム関係 • J-STAGEバーチャルイシュー機能 ②サービス関係 • 編集登載システムの各種機能に関するオンライン講習会の開催 • J-STAGEセミナー…2023年度第1回セミナーテーマ「国内外の動向を踏まえ たジャーナルのオープンアクセス化」
• ジャーナル・インパクトファクター取得にむけたセミナー(9月予定) 6
XML関連のトピック 7 カレント誌に占める 全文XML登載誌数の 割合:2% 全文XML作成ツール リリース(2020年) JATS1.1へのバージョン アップ(2019年) 892
945 985 997 1,321 1,681 2,178 2,497 2,662 2,919 3,156 117 229 385 454 576 965 1,087 1,502 1,585 1,718 1,847 20 32 34 37 45 63 75 109 119 148 161 0 500 1,000 1,500 2,000 2,500 3,000 3,500 1 2 3 4 5 6 7 8 9 10 11 XML形式利用誌数の推移 系列1 系列2 系列3 カレント誌に占める全文 XML登載誌数の割合:5% +12 +2 +3 +8 +18 +12 +34 +10 +29 全文XML新規導入誌数→ +13
J-STAGE登載誌の全文XML化が進まない根本原因を考える 令和3年度J-STAGE利用者満足度調査の回答 8 1, 49% 2, 24% 3, 27% 問16.
貴誌の全文XMLの利用状況および 移行予定を選んでください。【単一回答】 N=413 問17. 全文XMLへの移行を考えていない 理由を選んでください。【複数回答可】 N=203 全文XMLデータを 作成するコストが 高い:40誌 全文はPDF形式の公開 で十分と考えている: 119誌 全文XML形式の利点が よくわからない:68誌 82 21 6 12 1 42 19 その他 20誌
J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 9 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず
デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供 学協会で追加コストを 払う必要が無い 参考: http://tokizane.jp/Ref/TokiPDF/Tokizane-TeX-20121027.pdf https://www.springernature.com/jp/landing/text-and-data-mining
J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 10 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず
デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる 学協会で追加コストを 払う必要が無い J-STAGE登載時に自動で 全文XML化されるような 仕組み……? • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供
J-STAGE登載誌の全文XML化が進まない根本原因を考える 海外大手出版社のようにはいかないのか? 11 原稿受理 全文XML化 公開 海外大手出版社の出版作業フロー:「利点がわからない」「データ作成のコスト が高い」という問題は発生しない 学協会側の全文XML化に 対する理解にかかわらず
デフォルトで作業フローに 組み込まれている 全文XML化による付加価値が 著者・研究者へ還元されている • 原稿はすべて出版社側で 全文XML化 • オフショアで作業しており スケールメリットが生じる 学協会で追加コストを 払う必要が無い J-STAGE登載時に自動で 全文XML化されるような 仕組み……? 学協会が低コストで XMLデータを作成 できるような支援 全文XML化による付加価値を 理解してもらう • すべての論文がHTMLで 全文閲覧可能 • テキストデータマイニング (TDM)による検索ソリュー ションを提供
全文XML作成ツールに関する直近の取組 • 2022年3月の改修により操作性や作業効率を改善(下図参照) • 利用促進支援の準備中…講習会開催、操作概要動画の改訂など 12 改修前:XMLエディタによる編集のみ 改修後:複数原稿の一括変換、GUIで編集、PDF自動生成 • J-STAGEにおいても、書誌XMLで登載した
記事を全文XMLで登載しなおせるよう対応 (履歴なし記事訂正扱い)
Jxiv (ジェイカイブ): JSTのプレプリントサーバ トピック② 13
プレプリントとは何か • 医学系のプレプリントサーバ でCOVID-19関連の研究が 迅速に公開されたことで COVID-19感染対策が躍進、 プレプリントという公開形態 に注目が集まる 14 •
プレプリント:査読を経ずに成果を公開することで研究サイクルの加速を図る、研究 成果流通の手段の一つ • プレプリントサーバ(プレプリントをインターネット上で公開するウェブサイト):物理 学・数学分野などのプレプリントを公開するarXiv(1991年設立)が発祥
Jxiv立ち上げの背景 15 小柴等, 林和弘,伊藤裕子 (2020) http://doi.org/10.15108/dp186 西川開 (2022) https://doi.org/10.15108/dp204 COVID-19関連のプレプリントの投稿元の国別内訳
• 海外諸国と比較して日本からのプレプ リントの公開は少ない →研究サイクルが他国より遅れる →研究の先取権争いで日本の研究者 が不利になる などの懸念 • 日本の研究者の間でプレプリントの利 用が広がらない原因 – 必要性を感じない – 適当な分野のサーバが見つ からない、など 日本の研究者が利用しやすい プレプリントサーバの構築
Jxivの特徴 16 トップ画面 (https://jxiv.jst.go.jp/)
Jxivの特徴 17 書誌画面 本文PDF
Jxivの特徴 • 対象分野:すべて(自然科学、人文・ 社会科学の既存の枠組みを超えて、 学際的な内容も取り扱う) • 対象言語:日本語、英語 • 投稿にはresearchmap IDまたは
ORCID IDが必要 • 投稿から公開までのフロー:右図参 照(他のサーバとほぼ同じ) • PKP*1のOPS*2をベースにカスタマイ ズして開発 18 *1 Public Knowledge Project:学術出版の質の向上 を目的にオープンソースソフトウェアの開発・研究を 行う、複数の大学による国際的なイニシアチブ *2 Open Preprint Systems:オープンソースのプレプ リントサーバシステム
Jxivに関する反響 • Jxiv運用開始後のTwitter上の反応(要約) – 肯定的な意見 「日本語で投稿できるのはよい」「国内で運営されていると安心」 – 否定的な意見 「既存のサーバが確立されているので不要」「利用が広がるかどうか疑問」 •
各種メディアでの報道 – 2022/5/15 日本経済新聞 「査読前論文、日本から発信 JST、投稿サイトを開設」 – 2022/6/6 Nature “Japan launches preprint server — but will scientists use it?” – 2023/6/12 Scholarly Kitchen “A Year of Jxiv – Warming the Preprints Stone” – その他、国内の科学系情報誌でも複数誌に取り上げられる 19
Jxivの運用状況 • 特定の分野に偏り過ぎず 幅広く投稿がある • 公開数ゼロの分野もある • 学際系や人社系は日本語 での投稿が多い傾向 20
分 野 生 物 学 ・ 生 命 科 学 ・ 基 礎 医 学 農 学 ・ 食 品 科 学 情 報 科 学 環 境 学 学 際 科 学 哲 学 ・ 宗 教 人 類 学 ・ 史 学 ・ 地 理 学 文 学 ・ 言 語 学 ・ 芸 術 学 法 学 ・ 政 治 学 経 済 学 ・ 経 営 学 社 会 学 心 理 学 ・ 教 育 学 英 35 4 7 2 0 0 0 2 0 1 2 2 日 10 6 14 1 7 1 1 5 5 26 2 7 分 野 数 学 物 理 学 化 学 地 球 科 学 ・ 天 文 学 一 般 医 学 ・ 社 会 医 学 ・ 看 護 学 歯 学 薬 学 臨 床 医 学 一 般 工 学 ・ 総 合 工 学 ナ ノ ・ 材 料 科 学 建 築 学 ・ 土 木 工 学 機 械 工 学 電 気 電 子 工 学 英 5 5 1 9 12 2 0 1 3 5 4 8 0 日 0 7 6 3 3 0 0 0 4 2 3 0 0 • 公開記事の分野別・言語別内訳(2023年8月3日時点) • 総公開記事数:223 • 総ダウンロード数: 138,884
Jxivの今後の課題 • 国内学協会(主にJ-STAGE登載誌)との連携強化 – プレプリントとして公開した内容の扱いについて、「既知の内容」とする (=投稿を受け付けない)、もしくは規定の無いジャーナルが多い →説明会を開催し、投稿規程の改訂を検討するよう呼びかけ →Jxivへの投稿を推奨しているジャーナルのリストをJxivのウェブサイト に掲示して相互発展を見込む(6月末時点で75誌) https://jxiv.jst.go.jp/index.php/jxiv/announcement/view/4
• 機能強化 • 運営体制の最適化 21
プレプリントとXMLの関係 • プレプリント界隈における全文XML化の動きは極めて小さい – Jxiv含め、多くのプレプリントサーバは全文HTML表示ができない…ベースシステ ムが対応していないため(関連データとしてXMLファイルの添付は可) • 特殊な例:bioRxivとmedRxivはHTMLで全文閲覧が可能 – いずれもCold
Spring Harbor Laboratoryが運営、HighWire社が開発 – 受理されたプレプリントはXML変換処理にかけられ、PDF公開から2日ほど経っ て全文HTMLが公開される • プレプリントの全文XML化における第一の課題は、ベースシステム側が(必 要性を認識して)全文XMLに対応できる環境を整備するところにある 22
ご静聴ありがとうございました 23