Upgrade to Pro — share decks privately, control downloads, hide ads and more …

全文 XML 作成ツールについて

XSPA
April 26, 2021

全文 XML 作成ツールについて

学術情報XML推進協議会セミナー
日時 :2021年4月26日(月曜日)
場所:WEB会議システム ZOOM

XSPA

April 26, 2021
Tweet

More Decks by XSPA

Other Decks in Technology

Transcript

  1. 全文XML作成ツール
    について
    -学術情報XML推進協議会 ウェビナー-
    令和3年4月26日
    情報基盤事業部 久保田 壮一

    View Slide

  2. 本日の内容
    1. J-STAGEのデータ形式変遷
    2. XML化状況
    3. 昨年9月リリース機能ご紹介:
    全文XML作成ツール / PMC・DOAJ形式ファイルダウンロード機能
    4. リリース後の対応
    5. リリース後の課題
    6. 今後の全文XML化プロジェクト
    7. 将来の展開(案)
    2

    View Slide

  3. 1.J-STAGEデータ形式変遷
    • TeX ?1999-?
    • Diov 2002-?
    • SGML 1999-2019
    • BIB 1999-2019
    • XHTML 2004-2012
    • JATS XML 2012-
    3
    J-STAGE
    1
    J-STAGE
    2
    J-STAGE
    3

    View Slide

  4. 2.J-STAGE XML化状況
    • XML登載状況
    • 利用者満足度調査結果
    • 全文XML化プロジェクトアンケート結果
    4

    View Slide

  5. 2.J-STAGE XML化状況
    5
    892 945 985 997
    1,321
    1,681
    2,178
    2,497
    2,662
    117
    229
    385
    454
    576
    965
    1,087
    1,502
    1,585
    20 32 34 37 45 63 75 109 119
    0
    500
    1,000
    1,500
    2,000
    2,500
    3,000
    XML形式利用誌数の推移
    カレント誌数 うち、書誌XML形式 うち、全文XML形式
    2012年度末 2013年度末 2014年度末 2015年度末 2016年度末 2017年度末 2018年度末 2019年度末 2021年4月現在
    892 945 985 997 1,321 1,681 2,178 2,497 2,662
    117 229 385 454 576 965 1,087 1,502 1,585
    20 32 34 37 45 63 75 109 119
    カレント誌数
    うち、書誌XML形式
    うち、全文XML形式

    View Slide

  6. 2.J-STAGE XML化状況
    6
    29,000
    30,000
    31,000
    32,000
    33,000
    34,000
    35,000
    36,000
    520,000
    540,000
    560,000
    580,000
    600,000
    620,000
    640,000
    660,000
    680,000
    03-2020
    04-2021
    書誌/全文XML記事数
    書誌XML 全文XML

    View Slide

  7. 2.J-STAGE XML化状況
    7
    0
    100,000
    200,000
    300,000
    400,000
    500,000
    600,000
    700,000
    03-2020
    04-2021
    書誌/全文XML記事数
    書誌XML 全文XML

    View Slide

  8. 2.J-STAGE XML化状況
    • J-STAGEでは登載誌の発信力を強化するため全文XML化を推進しています。貴誌
    における全文XMLの利用状況及び移行予定について教えてください。(1つ選択)
    利用者満足度調査結果2020①
    8
    17.3
    19.3
    63.4
    利用している
    今後移行する予定、ある
    いは検討中である
    移行を考えていない
    N=519

    View Slide

  9. 2.J-STAGE XML化状況
    • 全文XML形式への移行を考えていない理由を教えてください。(複数選択可)
    利用者満足度調査結果2020②
    9
    N=329
    53.8
    42.9
    25.2
    8.5
    0.0
    10.0
    20.0
    30.0
    40.0
    50.0
    60.0
    PDFで十分 全文XML利点不明 コスト高い その他

    View Slide

  10. 2.J-STAGE XML化状況
    • 全文XML化支援ツールを提供していますが。利用していますか。また、どのような
    ファイル形式に対応しているとよいですか。(複数選択可)
    利用者満足度調査結果2020③
    10
    N=519
    39.3
    17.7
    7.9
    1.3
    27.7
    15.6
    0.0
    10.0
    20.0
    30.0
    40.0
    50.0
    PDF
    ツール知ら
    なかった、
    今後利用
    したい
    利用して
    いる
    その他の
    ファイル形

    利用した
    いと思わ
    ない
    その他

    View Slide

  11. 3.全文XMLツール
    • 2020/9/26リリース
    11

    View Slide

  12. 全文XMLツール
    12
    WordもしくはLaTeX形式の原稿ファイルを元に、J-STAGEに登載で
    きる全文XMLファイルを作成・編集できるツールです。
    原稿ファイル
    原稿変換
    全文XML
    ファイル
    作成した全文XML
    ファイルは
    別途、編集登載シ
    ステムにアップロ
    ードする
    必要があります。
    ■原稿ファイルを元にXMLデータが生成されます。
    ■その後ツール上でXMLを確認・編集します。
    ■ツール内にプレビュー機能があり、J-STAGEの公開画面イメージを確認できます。
    ■ 全文XML作成ツールの詳細は「J-STAGE全文XML作成ツール利用者向け操作マニュアル」を参照。

    View Slide

  13. PMC、DOAJ形式ファイル ダウンロード機能
    13
    J-STAGEに登載済みの記事データより、PMC、DOAJに対応した形
    式のXMLファイルをダウンロードできます。
    13
    ダウンロード
    XML登載 - 記事作成・管理
    PMC形式
    ■ PMC、DOAJ(ja)、DOAJ(en)の形式を選択してダウンロードす
    る機能を追加します。
    ■ PMC形式は資料がPMCで審査・採択されており全文XML形
    式で登載された記事のみ利用可能です。
    DOAJ形
    式(日)
    DOAJ形
    式(英)
    ■ PMC、DOAJへのアップロードに利用可能です。
    XML
    形式を選択してダウンロード
    登載したXML形式を
    確認可能

    View Slide

  14. 4.全文XMLツール リリース後の対応
    ➢ 操作説明動画を作成・公開
    ➢ 不具合対応
    ➢Wordの原稿で引用文献に見出しの記述がない場合、
    原稿変換時に引用文献が正しく変換されない不具合
    :対応済み
    ➢Wordの原稿変換を行うと、italic前後の空白スペース
    がなくなることがあった不具合:対応済み
    14

    View Slide

  15. 5.全文XMLツール リリース後の課題(1)
    ➢ Wordファイルの引用文献にBibのスタイル名を設定し、その引用文献欄に“引用文献”
    の文言で見出し設定して原稿変換したところ、本文内のタイトル情報
    (配下)に“引用文献”が出力されており、プレビューで確認すると引
    用文献欄のタイトルとしてはWordファイルに記載していない“Reference List”の文字
    列が表示されてしまう。
    ➢ Wordファイルにセルの結合や非表示の罫線を使用する表を掲載していた場合、原稿
    変換で正常な変換が行われずDTDエラーとなるXMLが生成される。
    ➢ 原稿変換時に数式は一律MathMLで出力されているが、LaTeXの原稿の場合は
    TexMathで出力して欲しい。
    ➢ Wordの原稿変換したところ、表内に多数のが出力されエラーとなる。
    原稿変換時の不具合・改善要望
    15

    View Slide

  16. 5.全文XMLツール リリース後の課題(2)
    ➢ Wordファイルで本文中の参照リンクを図表などにハイパーリンクで設定して原稿変換
    したところ、プレビュー画面で正しくリンク先に飛ばない。
    ➢ 本文画像を使用する原稿をXML編集で編集を行い、プレビューでは本文画像が正しく
    表示されている状態だったため、XML編集画面のXMLをコピーして別のXMLエディタ
    ーで編集を行い、生成したXMLファイルを編集登載システムにアップロードを行ったと
    ころ、編集登載システムのプレビュー画面では本文画像が表示されなかった。
    ➢ 全文XML作成ツールのXML編集画面のプレビューと、編集登載システムのプレビュー
    とで表示が異なる箇所があった。
    ➢ back内にref-listを複数記載した場合 など
    プレビューの不具合・改善要望
    16

    View Slide

  17. 5.全文XMLツール リリース後の課題(3)
    ➢ XML編集で不完全なXML記述のままだと一時保存できない。保存できるようにして欲
    しい。
    ➢ XML編集中の入力候補表示について、各要素内で記述可能な要素のみを候補表示
    すべき。
    ➢ 引用文献のタグであるにidを付与しないと、全文HTML作成処理
    が誤動作し、すべてのリンクが同一の引用文献を指す。
    その他の不具合・改善要望など
    17

    View Slide

  18. 5.全文XMLツール リリース後の課題(4)
    ➢ 編集登載システムの全文HTMLプレビューについて、XMLアップロード後にプレビュー
    を使用するのに最大30分かかる。オンタイム変換を望む。
    ➢ 全文HTMLの本文中で参照している引用のリンクをクリックしても、該当の引用文献で
    はなく、すべて引用文献の見出しへリンクされてしまう。
    関連したJ-STAGEシステムへの要望など
    18

    View Slide

  19. 6.今後の全文XML化プロジェクト
    ➢ 全文XML作成に意欲的な学会へのヒアリングを行いつつ
    システム改修を進める
    ➢ 既存ツールを活用した効率的なデータ作成支援、広報
    19

    View Slide

  20. 6.今後の全文XML化プロジェクト
    20
    J-STAGE
    編集登載
    システム
    書誌XML
    ツール
    PDF 書誌のみ
    XML
    ZIP
    アップロード
    (手動)
    データの作成・登載手順が煩雑なため
    全文XMLの導入が進んでいない
    現状 改修後
    原稿ファイルがあれば登載に必要な
    データを生成しワンストップで登載可能
    Word 全文XML
    ツール
    PDF
    全文
    XML
    (別途作成しzipファイルへの統合が必要)
    ZIP
    =登載に必要なファイル
    J-STAGE
    編集登載
    システム
    Word XML
    ツール
    PDF
    全文
    XML
    直接J-STAGE登載
    まで可能とする
    全文XML登載への移行を促す
    ●書誌のみXMLでの登載
    ●全文XMLでの登載
    アップロード
    (手動)

    View Slide

  21. 7.将来の展開(案)
    ➢ XML化によるメリットが実感できるような機能拡張
    ➢例:機械翻訳、他システム連携、スマホ、タブレット特化機能
    ➢ 過去掲載論文のXML化
    ➢ AI・論文情報を利用したビッグデータ研究などとの連携
    ➢ RORやGrantIDなどの識別子連携対応
    ➢ JATS XMLバージョンアップ
    21

    View Slide

  22. 最後に
    ·
    · 平素はJ-STAGE事業にご理解、ご協力を賜り誠にありがとうございます。
    · J-STAGEの全文XML化を推進していくには皆様のご協力が不可欠です。
    · 今後とも引き続き、よろしくお願い申し上げます。
    ·
    22

    View Slide