Upgrade to Pro — share decks privately, control downloads, hide ads and more …

JATS-Con 2016報告 -スキマトロンが活躍する欧米のジャーナル編集- / 20160805-xml-tokizane

XSPA
August 19, 2016

JATS-Con 2016報告 -スキマトロンが活躍する欧米のジャーナル編集- / 20160805-xml-tokizane

学術情報XML推進協議会 講演会
日時: 2016 年 8 月 5 日 (金曜日) 15:20-17:30
場所: カクタス・コミュニケーションズ株式会社

XSPA

August 19, 2016
Tweet

More Decks by XSPA

Other Decks in Technology

Transcript

  1. JATS-Con 2016報告
    スキマトロンが活躍する
    欧米のジャーナル編集
    2016/8/5
    時実 象一

    View Slide

  2. JATS-Con とは
    • JATS の元になった NLM-DTD の開発者、米国国立医学
    図書館 (National Library of Medicine: NLM) が毎年開催
    • JATS に関する技術会議
    – JATS の使用経験
    – JATS に対する意見
    – 今後の報告についての議論
    – 関連する話題
    • 毎年 4 月、Bethesda, MD
    – 2010-2012 は 9/10 月に開催
    – 2013 年は米国政府の閉鎖で中止となる
    2

    View Slide

  3. JATS-Con 2016
    • April 12 & 13, 2016
    • Lister Hill Auditorium at the U.S. National Library of
    Medicine, NIH, Bethesda, Maryland
    3

    View Slide

  4. JATS-Con の発表トピック
    4

    View Slide

  5. JATS-Con 2016 の特徴
    • Schematron の利用例が目立った
    • 執筆・投稿・編集システムの報告がいく
    つかあった
    • JATS の拡張として、「標準」文書用のタ
    グセットが報告された
    • JATS の利用ガイドライン、JATS4R が公
    開された
    • BITS の利用も進んでいる
    5

    View Slide

  6. Schematron とは (1)
    • Schematron とは整形式で書かれた XML
    を検査して、指定された条件に合うデー
    タを見つけるツールである
    – スキーマでチェックできないチェック
    • (例)「受理年は 2014 年以降でなくてはならない」
    – パターンを発見
    • (例)「著者履歴が記載されていない著者の一覧を
    出力」
    • oXygen に標準で実装されている
    6

    View Slide

  7. Schematron とは (2)
    – 複雑なチェックも可能
    • 「図は本文中に引用が必要」
    • 「セクション表題の長さは最大450文字」
    • 「Lab Reportの著者の数は最大6名」
    • 「引用文献はすべて文中て引用が必要」
    • 「図は文中で少なくとも1回、最大5回まで引用」
    • 「キーワードは重複してはいけない」
    • 「記事の先頭ページは最終ページより小さい、ただし編集後
    記は最終ページで始まって、内部ページにつづいてもよい」
    • 「出版日は の中以外はISO dates」
    • 「抄録は1パラグラフ」
    • 「意見欄の筆者は になる」
    7

    View Slide

  8. Schematron 実施例 (1)
    • 学術論における研究助成情報の特定と標
    準化のための出版社の解決策
    Identifying and Standardizing Funding Information in Scholarly Articles:
    a Publisher's Solution - M. Scott Dineen, OSA—The Optical Society
    – CrossRef の Funding Information データベー
    スをダウンロードし、これを出版論文の研究
    助成情報に利用



    – Schematron でチェック
    8

    View Slide

  9. Schematron 実施例 (2)
    • SchematronとHTML報告システムで
    JATS/BITSのQAツール作成
    A Quality Assurance Tool for JATS/BITS with Schematron and HTML
    reporting
    9

    View Slide

  10. Schematron 実施例 (3)
    • BITSの実用: Cambridge University Press
    の経験
    An Implementation of BITS: The Cambridge University Press
    Experience
    – 内部用に SGML, CamML, CJML, CBML など
    のさまざまな DTD → JATS/BITS に統一
    – Schematron でデータの変換の際の整合性を
    チェック
    10

    View Slide

  11. Schematron 実施例 (4)
    • 執筆1回、多方面利用 - ウェブでアクセス
    できるoXygenを使った仕組み
    Write once, use everywhere — making an oXygen Framework
    accessible on the Web
    – oXgen 上で Schematron によるリアルタイ
    ム・チェック / 修正をおこなう
    11

    View Slide

  12. 執筆・投稿・編集
    • eLifeの投稿システムでのXMLの収集: 2歩
    前進、1歩後退
    Collecting XML at article submission at eLife: two steps forward, one
    step back?
    – 投稿システムでメタデータをできるだけ集め
    ようとしたが、著者は Word を好むので、ハ
    イブリッドのシステムとし、QC で対応。
    – Amazon Web Services を利用
    12

    View Slide

  13. 多言語対応
    • 多言語JATS出版ワークフロー実施におけ
    る問題点
    • Challenges in Implementing a Multilingual JATS Publishing
    Workflow
    – フォントはUnicodeで多言語が処理できるが、言語によりフォン
    トをダイナミックに変更する必要
    – ラテン系文書ではフォントに4種類 (bold, italic, small caps and
    underline) 以上の形がある。たとえばboldでなくsemiboldの場合
    もある。italicでなくobliqueであるかもしれない。
    – 非ラテン語ではこれらは意味がない。「強調」を翻訳する場合
    はフォントを変更する必要がある。
    – アラビア語では、範囲を表すとき、1.09-2.22と書かず、2.22-
    1.09と書く。
    13

    View Slide

  14. 多言語対応
    14

    View Slide

  15. 多言語対応
    15

    View Slide

  16. 多言語対応
    16

    View Slide

  17. 多言語対応
    • 結論
    – JATS, BITS, STSでは複数言語の同時処理は
    考慮されていないが、特に必要はないと思
    う。
    – 多言語工程ではフォントの選択が必要となる
    – JATSにbold, italic, small caps, underlieをまと
    めたタグがあるとよい
    – 翻訳のための執筆、編集、マークアップの
    ルールが必要。
    – JATS, BITS, STSは多言語出版に適している
    17

    View Slide

  18. 数式
    • 数式をMicrosoft WordからJATS XMLワー
    クフローへの移行についての論考
    Wrangling Math from Microsoft Word into JATS XML Workflows
    – Word 中の数式表現
    • テキスト
    • グラフィック
    • Formula Field
    • Design Science MathType, Microsoft Equation
    Editor
    • Microsoft Equation Builder
    18

    View Slide

  19. 数式
    • MathType
    19

    View Slide

  20. NISO STS プロジェクト (1)
    • NISO STSプロジェクトの概要と現況
    NISO STS Project Overview and Update
    – ISO STS (Standard Tag Set)
    • 2010年に開発、各国標準機関も採用
    20

    View Slide

  21. NISO STS プロジェクト (2)
    – JATS の拡張
    1. 最上位のタグを から に変更
    2. と を , meta> (regional: ECなど), (national) に変
    更。
    3. 標準に使われる用語の定義のため、ISO 30042:2008の
    TermBase exchange (TBX) モデルを名前空間として採

    4. 要素の属性値を拡張し、また 要素を追

    5. 規格化されていない注釈や実例を記述する要素を追加
    – ISO STS をより広範に利用できるように改良
    21

    View Slide

  22. NISO STS プロジェクト (3)
    広範な標準関係機関・企業が参加
    • IEEE
    • NEN
    • IHS Global
    • SAE International
    • International Organization for
    Standardization (ISO)
    • Mulberry Technologies, Inc.
    • Signal Arc
    • Global Publishing Solutions (GPSL)
    • Cenveo Publisher Services
    • IEEE
    • Silverchair Information Systems
    • Finnish Standards Association SFS
    • BSI Standards Limited
    • Boeing
    • Office of the Asst Sec of Defense for
    Research & Engineering (OASD-R&E)
    • Data Conversion Laboratory, Inc.
    (DCL)
    • Mulberry Technologies, Inc.
    • Thomson Reuters
    • ASTM International
    • DIN Software GmbH
    • Copyright Clearance Center
    • European Committee for
    Standardization (CEN)
    • Ontario Council of University Libraries
    22

    View Slide

  23. JATS 一般 (1)
    • JATSを導入する際に決めなくてはならな
    いこと
    So You Want to Adopt JATS. What Decisions Do You Need To Make?
    1. JATS の種類 新規では Publishing
    2. 表 XHTML/HTML
    3. 数式 MathML
    4. 章・項目のラベル 記述しない
    5. 引用文献
    6. Alternative 導入はコストがかかる
    7. NISO ALI, ORCID, DOI コストが
    かかる
    23

    View Slide

  24. JATS 一般 (2)
    • JATS Back - Jeff Beck, NIH
    – STSやBITSはJATSの拡張
    – 拡張が増えると拡張間のCompatibilityがなく
    なる
    – 拡張のための規則、これは変更してよいが、
    これは変更してはいけない、あるいはこの要
    素の意味を変更してはいけない、という規則
    を作ろうとしている。
    24

    View Slide

  25. JATS 一般 (3)
    • Bending JATS - Sheridan
    – JATSの標準的な書き方に合わない要求
    • 共著者名を脚注に入れて欲しい
    • 著者所属機関は脚注に入れて欲しい
    • URLが長いとき、ZERO WIDTH SPACE ​を挿入
    • タイトルをBoldで記述して欲しい。
    • 複数の補助資料があるとき、余分のスペースやライン・ブ
    レークの挿入を要求。
    • Bio labelをテキストと別のパラグラフで記述するように指
    示。
    • 電子版ではページ番号を付与してはいけない、との指示だ
    が、表示の時に消せばいいのではないか。
    25

    View Slide

  26. JATS 一般 (4)
    • JATS4R
    – JATSの再利用が容易になるように、記述方法
    のガイドラインを勧告
    26

    View Slide

  27. JATS 一般 (4)
    • General recommendations
    – XML Structure
    – DOCTYPE declarations (DTD)
    – @noNamespaceSchemaLocation attribute (XSD)
    – xml-model processing instruction
    – Character encoding (UTF-8またはUTF-16)
    – Character entity references
    – @dtd-version attribute
    • Citations recommendations

    – @publication-type
    – その他
    • Data citations
    • Math
    • Permissions
    27

    View Slide

  28. JATS 一般 (5)
    • JATS DTDの動的画像表示 - Chris
    Maloney (http://jatspan.org/niso/publishing-1.1)
    28

    View Slide

  29. 29

    View Slide

  30. 30

    View Slide

  31. 31

    View Slide