Upgrade to Pro — share decks privately, control downloads, hide ads and more …

JATS-Con 2016報告 -スキマトロンが活躍する欧米のジャーナル編集- / 20160805-xml-tokizane

XSPA
August 19, 2016

JATS-Con 2016報告 -スキマトロンが活躍する欧米のジャーナル編集- / 20160805-xml-tokizane

学術情報XML推進協議会 講演会
日時: 2016 年 8 月 5 日 (金曜日) 15:20-17:30
場所: カクタス・コミュニケーションズ株式会社

XSPA

August 19, 2016
Tweet

More Decks by XSPA

Other Decks in Technology

Transcript

  1. JATS-Con とは • JATS の元になった NLM-DTD の開発者、米国国立医学 図書館 (National Library

    of Medicine: NLM) が毎年開催 • JATS に関する技術会議 – JATS の使用経験 – JATS に対する意見 – 今後の報告についての議論 – 関連する話題 • 毎年 4 月、Bethesda, MD – 2010-2012 は 9/10 月に開催 – 2013 年は米国政府の閉鎖で中止となる 2
  2. JATS-Con 2016 • April 12 & 13, 2016 • Lister

    Hill Auditorium at the U.S. National Library of Medicine, NIH, Bethesda, Maryland 3
  3. JATS-Con 2016 の特徴 • Schematron の利用例が目立った • 執筆・投稿・編集システムの報告がいく つかあった •

    JATS の拡張として、「標準」文書用のタ グセットが報告された • JATS の利用ガイドライン、JATS4R が公 開された • BITS の利用も進んでいる 5
  4. Schematron とは (1) • Schematron とは整形式で書かれた XML を検査して、指定された条件に合うデー タを見つけるツールである –

    スキーマでチェックできないチェック • (例)「受理年は 2014 年以降でなくてはならない」 – パターンを発見 • (例)「著者履歴が記載されていない著者の一覧を 出力」 • oXygen に標準で実装されている 6
  5. Schematron とは (2) – 複雑なチェックも可能 • 「図は本文中に引用が必要」 • 「セクション表題の長さは最大450文字」 •

    「Lab Reportの著者の数は最大6名」 • 「引用文献はすべて文中て引用が必要」 • 「図は文中で少なくとも1回、最大5回まで引用」 • 「キーワードは重複してはいけない」 • 「記事の先頭ページは最終ページより小さい、ただし編集後 記は最終ページで始まって、内部ページにつづいてもよい」 • 「出版日は <season> の中以外はISO dates」 • 「抄録は1パラグラフ」 • 「意見欄の筆者は <editor> になる」 7
  6. Schematron 実施例 (1) • 学術論における研究助成情報の特定と標 準化のための出版社の解決策 Identifying and Standardizing Funding

    Information in Scholarly Articles: a Publisher's Solution - M. Scott Dineen, OSA—The Optical Society – CrossRef の Funding Information データベー スをダウンロードし、これを出版論文の研究 助成情報に利用 • <article-meta> • <back> • <ack> – Schematron でチェック 8
  7. Schematron 実施例 (3) • BITSの実用: Cambridge University Press の経験 An

    Implementation of BITS: The Cambridge University Press Experience – 内部用に SGML, CamML, CJML, CBML など のさまざまな DTD → JATS/BITS に統一 – Schematron でデータの変換の際の整合性を チェック 10
  8. Schematron 実施例 (4) • 執筆1回、多方面利用 - ウェブでアクセス できるoXygenを使った仕組み Write once,

    use everywhere — making an oXygen Framework accessible on the Web – oXgen 上で Schematron によるリアルタイ ム・チェック / 修正をおこなう 11
  9. 執筆・投稿・編集 • eLifeの投稿システムでのXMLの収集: 2歩 前進、1歩後退 Collecting XML at article submission

    at eLife: two steps forward, one step back? – 投稿システムでメタデータをできるだけ集め ようとしたが、著者は Word を好むので、ハ イブリッドのシステムとし、QC で対応。 – Amazon Web Services を利用 12
  10. 多言語対応 • 多言語JATS出版ワークフロー実施におけ る問題点 • Challenges in Implementing a Multilingual

    JATS Publishing Workflow – フォントはUnicodeで多言語が処理できるが、言語によりフォン トをダイナミックに変更する必要 – ラテン系文書ではフォントに4種類 (bold, italic, small caps and underline) 以上の形がある。たとえばboldでなくsemiboldの場合 もある。italicでなくobliqueであるかもしれない。 – 非ラテン語ではこれらは意味がない。「強調」を翻訳する場合 はフォントを変更する必要がある。 – アラビア語では、範囲を表すとき、1.09-2.22と書かず、2.22- 1.09と書く。 13
  11. 多言語対応 • 結論 – JATS, BITS, STSでは複数言語の同時処理は 考慮されていないが、特に必要はないと思 う。 –

    多言語工程ではフォントの選択が必要となる – JATSにbold, italic, small caps, underlieをまと めたタグがあるとよい – 翻訳のための執筆、編集、マークアップの ルールが必要。 – JATS, BITS, STSは多言語出版に適している 17
  12. 数式 • 数式をMicrosoft WordからJATS XMLワー クフローへの移行についての論考 Wrangling Math from Microsoft

    Word into JATS XML Workflows – Word 中の数式表現 • テキスト • グラフィック • Formula Field • Design Science MathType, Microsoft Equation Editor • Microsoft Equation Builder 18
  13. NISO STS プロジェクト (1) • NISO STSプロジェクトの概要と現況 NISO STS Project

    Overview and Update – ISO STS (Standard Tag Set) • 2010年に開発、各国標準機関も採用 20
  14. NISO STS プロジェクト (2) – JATS の拡張 1. 最上位のタグを <article>

    から <standard> に変更 2. <journal-meta> と <article-meta> を <iso-meta>, <reg- meta> (regional: ECなど), <nat-meta> (national) に変 更。 3. 標準に使われる用語の定義のため、ISO 30042:2008の TermBase exchange (TBX) モデルを名前空間として採 用 4. <std> 要素の属性値を拡張し、また <std-ref> 要素を追 加 5. 規格化されていない注釈や実例を記述する要素を追加 – ISO STS をより広範に利用できるように改良 21
  15. NISO STS プロジェクト (3) 広範な標準関係機関・企業が参加 • IEEE • NEN •

    IHS Global • SAE International • International Organization for Standardization (ISO) • Mulberry Technologies, Inc. • Signal Arc • Global Publishing Solutions (GPSL) • Cenveo Publisher Services • IEEE • Silverchair Information Systems • Finnish Standards Association SFS • BSI Standards Limited • Boeing • Office of the Asst Sec of Defense for Research & Engineering (OASD-R&E) • Data Conversion Laboratory, Inc. (DCL) • Mulberry Technologies, Inc. • Thomson Reuters • ASTM International • DIN Software GmbH • Copyright Clearance Center • European Committee for Standardization (CEN) • Ontario Council of University Libraries 22
  16. JATS 一般 (1) • JATSを導入する際に決めなくてはならな いこと So You Want to

    Adopt JATS. What Decisions Do You Need To Make? 1. JATS の種類 新規では Publishing 2. 表 XHTML/HTML 3. 数式 MathML 4. 章・項目のラベル 記述しない 5. 引用文献 <mixed-citation> 6. Alternative 導入はコストがかかる 7. NISO ALI, ORCID, DOI コストが かかる 23
  17. JATS 一般 (2) • JATS Back - Jeff Beck, NIH

    – STSやBITSはJATSの拡張 – 拡張が増えると拡張間のCompatibilityがなく なる – 拡張のための規則、これは変更してよいが、 これは変更してはいけない、あるいはこの要 素の意味を変更してはいけない、という規則 を作ろうとしている。 24
  18. JATS 一般 (3) • Bending JATS - Sheridan – JATSの標準的な書き方に合わない要求

    • 共著者名を脚注に入れて欲しい • 著者所属機関は脚注に入れて欲しい • URLが長いとき、ZERO WIDTH SPACE &#x200Bを挿入 • タイトルをBoldで記述して欲しい。 • 複数の補助資料があるとき、余分のスペースやライン・ブ レークの挿入を要求。 • Bio labelをテキストと別のパラグラフで記述するように指 示。 • 電子版ではページ番号を付与してはいけない、との指示だ が、表示の時に消せばいいのではないか。 25
  19. JATS 一般 (4) • General recommendations – XML Structure –

    DOCTYPE declarations (DTD) – @noNamespaceSchemaLocation attribute (XSD) – xml-model processing instruction – Character encoding (UTF-8またはUTF-16) – Character entity references – @dtd-version attribute • Citations recommendations – <ref id=”…”> – @publication-type – その他 • Data citations • Math • Permissions 27
  20. 29

  21. 30

  22. 31