Upgrade to Pro — share decks privately, control downloads, hide ads and more …

全文 XML 作成ツールについて

XSPA
April 26, 2021

全文 XML 作成ツールについて

学術情報XML推進協議会セミナー
日時 :2021年4月26日(月曜日)
場所:WEB会議システム ZOOM

XSPA

April 26, 2021
Tweet

More Decks by XSPA

Other Decks in Technology

Transcript

  1. 本日の内容 1. J-STAGEのデータ形式変遷 2. XML化状況 3. 昨年9月リリース機能ご紹介: 全文XML作成ツール / PMC・DOAJ形式ファイルダウンロード機能

    4. リリース後の対応 5. リリース後の課題 6. 今後の全文XML化プロジェクト 7. 将来の展開(案) 2
  2. 1.J-STAGEデータ形式変遷 • TeX ?1999-? • Diov 2002-? • SGML 1999-2019

    • BIB 1999-2019 • XHTML 2004-2012 • JATS XML 2012- 3 J-STAGE 1 J-STAGE 2 J-STAGE 3
  3. 2.J-STAGE XML化状況 5 892 945 985 997 1,321 1,681 2,178

    2,497 2,662 117 229 385 454 576 965 1,087 1,502 1,585 20 32 34 37 45 63 75 109 119 0 500 1,000 1,500 2,000 2,500 3,000 XML形式利用誌数の推移 カレント誌数 うち、書誌XML形式 うち、全文XML形式 2012年度末 2013年度末 2014年度末 2015年度末 2016年度末 2017年度末 2018年度末 2019年度末 2021年4月現在 892 945 985 997 1,321 1,681 2,178 2,497 2,662 117 229 385 454 576 965 1,087 1,502 1,585 20 32 34 37 45 63 75 109 119 カレント誌数 うち、書誌XML形式 うち、全文XML形式
  4. 2.J-STAGE XML化状況 6 29,000 30,000 31,000 32,000 33,000 34,000 35,000

    36,000 520,000 540,000 560,000 580,000 600,000 620,000 640,000 660,000 680,000 03-2020 04-2021 書誌/全文XML記事数 書誌XML 全文XML
  5. 2.J-STAGE XML化状況 7 0 100,000 200,000 300,000 400,000 500,000 600,000

    700,000 03-2020 04-2021 書誌/全文XML記事数 書誌XML 全文XML
  6. 2.J-STAGE XML化状況 • 全文XML化支援ツールを提供していますが。利用していますか。また、どのような ファイル形式に対応しているとよいですか。(複数選択可) 利用者満足度調査結果2020③ 10 N=519 39.3 17.7

    7.9 1.3 27.7 15.6 0.0 10.0 20.0 30.0 40.0 50.0 PDF ツール知ら なかった、 今後利用 したい 利用して いる その他の ファイル形 式 利用した いと思わ ない その他
  7. 全文XMLツール 12 WordもしくはLaTeX形式の原稿ファイルを元に、J-STAGEに登載で きる全文XMLファイルを作成・編集できるツールです。 原稿ファイル 原稿変換 全文XML ファイル 作成した全文XML ファイルは

    別途、編集登載シ ステムにアップロ ードする 必要があります。 ▪原稿ファイルを元にXMLデータが生成されます。 ▪その後ツール上でXMLを確認・編集します。 ▪ツール内にプレビュー機能があり、J-STAGEの公開画面イメージを確認できます。 ▪ 全文XML作成ツールの詳細は「J-STAGE全文XML作成ツール利用者向け操作マニュアル」を参照。
  8. PMC、DOAJ形式ファイル ダウンロード機能 13 J-STAGEに登載済みの記事データより、PMC、DOAJに対応した形 式のXMLファイルをダウンロードできます。 13 ダウンロード XML登載 - 記事作成・管理

    PMC形式 ▪ PMC、DOAJ(ja)、DOAJ(en)の形式を選択してダウンロードす る機能を追加します。 ▪ PMC形式は資料がPMCで審査・採択されており全文XML形 式で登載された記事のみ利用可能です。 DOAJ形 式(日) DOAJ形 式(英) ▪ PMC、DOAJへのアップロードに利用可能です。 XML 形式を選択してダウンロード 登載したXML形式を 確認可能
  9. 5.全文XMLツール リリース後の課題(1) ➢ Wordファイルの引用文献にBibのスタイル名を設定し、その引用文献欄に“引用文献” の文言で見出し設定して原稿変換したところ、本文内のタイトル情報 (<body><sec><title>配下)に“引用文献”が出力されており、プレビューで確認すると引 用文献欄のタイトルとしてはWordファイルに記載していない“Reference List”の文字 列が表示されてしまう。 ➢

    Wordファイルにセルの結合や非表示の罫線を使用する表を掲載していた場合、原稿 変換で正常な変換が行われずDTDエラーとなるXMLが生成される。 ➢ 原稿変換時に数式は一律MathMLで出力されているが、LaTeXの原稿の場合は TexMathで出力して欲しい。 ➢ Wordの原稿変換したところ、表内に多数の<disp-quote>が出力されエラーとなる。 原稿変換時の不具合・改善要望 15
  10. 6.今後の全文XML化プロジェクト 20 J-STAGE 編集登載 システム 書誌XML ツール PDF 書誌のみ XML

    ZIP アップロード (手動) データの作成・登載手順が煩雑なため 全文XMLの導入が進んでいない 現状 改修後 原稿ファイルがあれば登載に必要な データを生成しワンストップで登載可能 Word 全文XML ツール PDF 全文 XML (別途作成しzipファイルへの統合が必要) ZIP =登載に必要なファイル J-STAGE 編集登載 システム Word XML ツール PDF 全文 XML 直接J-STAGE登載 まで可能とする 全文XML登載への移行を促す •書誌のみXMLでの登載 •全文XMLでの登載 アップロード (手動)