Upgrade to Pro — share decks privately, control downloads, hide ads and more …

JATS XML初心者実践セミナー_20260116_ Nakanishi Printing ...

Sponsored · Ship Features Fearlessly Turn features on and off without deploys. Used by thousands of Ruby developers.
Avatar for XSPA XSPA
January 16, 2026

JATS XML初心者実践セミナー_20260116_ Nakanishi Printing Company, Ltd

学術情報XML推進協議会(XSPA)JATS XML初心者実践セミナー
日付: 2026年1月16日 (金曜日) 15:00–17:00
場所: JST東京本部(四番町)住宅棟1階会議室

Avatar for XSPA

XSPA

January 16, 2026
Tweet

More Decks by XSPA

Other Decks in Technology

Transcript

  1. XMLの特徴 大文字小文字を区別する 改行記号・余分な半角スペースは無視される <nakanishi>≠<NAKANISHI> <社員情報> <社員番号>202101</社員番号> <氏名> <姓>中西</姓> <名>明日輝</名> </氏名>

    <部署>情報システム</部署> </社員情報> <社員情報><社員番号>202101</社員番号>< 氏名><姓>中西</姓><名>明日輝</名></氏名 ><部署>情報システム</部署></社員情報> = 予約文字(使ってはいけない文字)がある < > & “ ‘ ※ほかの文字で置き換えすることは可能 < = &lt; > = &gt; & = &amp; “ = &quot; ‘ = &apos;
  2. XMLの特徴 整形式(Well-formed)である 整形式 = 一定のルール(文法)で表記が成されていること。 XMLの場合、 ①機械が読み取れる。(手書きは不可) ②開始タグと終了タグがあり、<>で括られている。空タグは<br />等と書ける ③「属性」の値は“

    ”もしくは‘ ’でくくる。 ④ルート要素がひとつだけ必ずある。 Well-formedなだけの文書が許容されるのがXMLの特徴! 前身のSGMLでは各要素の定義(DTD)が必須だった。 要するに……書き方さえ整っていればXMLとして認める <root> <h1>中西印刷の紹介</h1> <p>中西印刷は、京都で操業する歴 史ある印刷会社の一社です。</p> </root> SGML = Standard Generalized Markup Language (標準化マーク付け言語) DTD = Document Type Definition (文書型定義)
  3. 木構造 XMLの構造は木構造(tree-structure)で表すことができる。 社員情報 氏名 社員番号 部署 姓 名 社員情報 姓

    社員番号 名 氏名 木構造 複数の親を持つノードがある時は 木構造ではない
  4. XMLの利活用 XMLはあくまでデータのフォーマット。 用意されているタグセットに応じて多種多様な種類のXML文書が存在 必要に応じて言語の自作も容易。草XMLも多数。 こうしたXMLの各形式のことを「言語」や「スキーマ」と呼ぶ。 HTML (ウェブページ記述) XML Schema (XML構造記述)

    Office Open XML Document(.docx) (Wordデータ形式) XSLT (XML変換) EPUB, XHTML (電子書籍) RDF、JATS (メタデータ記述) 全部「XML」! ニュースタイトル 投稿日時 本文URL etc 著者やタイトル、 引用文献リスト etc XMLに含まれるタ グの構造 タグごとのテキス ト要件仕様 etc 文書名や内容 使用されている フォント etc
  5. XMLを書いてみよう 実習問題1 次の表形式のデータを、XMLで記述してください。 要素名は適当に決めて構いません。 ただし、「四番町オフィス(BANビル)」は4Fであることを属性で表す必要 があります。 名前 ビル名 電話番号 本部

    川口センタービル 048-226-5601 東京本部 サイエンスプラザ 03-5214-8401 東京本部別館 K’s五番町 03-5214-8401 九段オフィス 九段センタービル 03-3512-3522 四番町オフィス BANビル 03-5214-8451 日本科学未来館 03-3570-9151
  6. JATS XML Journal Article Tag Suite 論文の構造を表現するXMLスキーマ J-STAGEにアップロードされるファ イルの指定形式でもある。 J-STAGE登載にはJATS形式の論文

    データが必要。 <Article Title> 論文のタイトル <ref> 引用文献情報 <contrib> 著者情報 <kwd> キーワード情報 <abstract> 抄録テキスト <sec> 各セクション etc
  7. JATSの種類 Journal Archiving and Interchange Tag Set Journal Publishing Tag

    Set 記事保存交換用タグセット。もっとも厳密で完全だが完全記述するのは重い。 構造制約は少なく、表現力が最大。どんな論文も正確に記述できるようにしている。 一言にJATS XMLといってもいくつかのタグセットがある。 基本的には、「どこまで厳密に書くか」「誰が主に使うか」で使い分ける 出版実務で使われるタグセット。本講で扱うのはコレ。 Archivingよりやや簡略化。出版工程を前提。J-STAGEが採用。 Article Authoring Tag Set 著者が直接書くための軽量JATS。構造制約は厳格で、例外に厳しい。 タグ数:★★★★★ 構造制約:緩やか 用途:国立機関による収蔵 タグ数:★★★★☆ 構造制約:ある程度柔軟 用途:出版社による編集 タグ数:★★☆☆☆ 構造制約:最も厳格 用途:著者の論文執筆
  8. 論文のid 原稿種別。 <subj-group><subject>内に記述する。 <article-title>論文タイトル <trans-title>他言語でのタイトル @xml-lang属性を使って言語を指定。 上記2タグは、<article-meta>の子として直接記述も可能 (別途サブタイトル等を使いたい場合はtitle-groupで囲う) article-meta <article-id>

    <article-id pub-id-type="doi">10.1073/pnas.181325198</article-id> <article-id pub-id-type="other">jPNAS.v98.i18.pg10214</article-id> <article-id pub-id-type="pmid">11517319</article-id> <article-categories> <subject>Retraction</subject> <subject>Biological Sciences</subject> <title-group> <article-meta> <artilce-title xml:lang=“ja”>中西の面白論文</article-title> <trans-title xml:lang=“en”>Nakanishi’s funny article</trans-title> </artilce-meta>
  9. 著者と所属機関の対応 <contrib contrib-type="author"> <name> <surname>Wigginton</surname> <given-names>Janis</given-names> </name> <xref ref-type="aff" rid="aff-1"/>

    </contrib> <aff id="aff-1">Department of Microbiology and Immunology, University of Michigan Medical School, Ann Arbor, MI 48109-0620</aff>
  10. 著者情報を書こう! 実習問題2 以下の書誌情報を含んだ、<article-meta>タグ以下の情報をJATS XML形式 で記述してください。以下の情報に含まれていないタグは省略して構いません。 学術論文原稿のXML化における生成AI技術の活用 ◦ 中西 明日輝 1),

    山本 剛 1), 中西 秀彦 1) 中西印刷株式会社 1) Utilizing Generative AI Technologies for XML Conversion of Academic Manuscripts Asuki NAKANISHI 1), Tsuyoshi YAMAMOTO1), Hidehiko NAKANISHI1) Nakanishi Printing Company Ltd. 1) 情報科学技術協会, 情報の科学と技術, 2025年75巻 Special Issue号
  11. 回答例2 <article-meta> <article-title xml:lang=“ja”>学術論文原稿のXML化における生成AI技術の活用</article-title> <trans-title xml:lang=“en”>Utilizing Generative AI Technologies for

    XML Conversion of Academic Manuscripts</trans-title> <contrib-group> <contrib> <name-alternatives> <name name-style=“eastern” xml:lang=“ja”> <surname>中西</surname><given-names>明日輝</given-names> </name> <name name-style=“western” xml:lang=“en”> <given-names>Asuki</given-names><surname>Nakahishi</surname> </name> </name-alternatives> <xref ref-type=“aff” rid=“1”/> </contrib> (中略..) </contrib-group> <aff-alternatives id=“1”> <aff xml:lang=“ja”>中西印刷株式会社</aff> <aff xml:lang=“en”>Nakanishi Printing Company ltd.</aff> </aff-alternatives> </article-meta>
  12. mixed-citation 引用文献に含まれる諸情報を記述する。 子タグとして各情報を格納可能だが、子タグと子タグの間に「,」などの区切 り文字を記述可能。 mixed-citation自体が、引用文献テキストの表記として機能する。 <mixed-citation publication-type="journal" publication-format="print"> <string-name><surname>Llanos De

    La Torre Quiralte</surname>, <given-names>M</given-names></string-name>, <string-name><surname>Garijo Ayestaran</surname>, <given-names>M</given-names></string-name>, <string-name><surname>Poch Olive</surname>, <given-names>ML</given-names></string-name>. <article-title xml:lang="es">Evolucion de la mortalidad infantil de La Rioja (1980-1998)</article-title>. [<trans-title xml:lang="en">Evolution of the infant mortality rate in la Rioja in Spain (1980-1998)</trans-title>]. <source>An Esp Pediatr</source>. <year iso-8601-date="2001-11">2001</year> <month>Nov</month>;<volume>55</volume>(<issue>5</issue>): <fpage>413</fpage>&ndash;<lpage>420</lpage>.</mixed-citation>
  13. 引用文献を書こう! 実習問題3 以下の引用文献情報を、JATS XML形式で記述してください。 <ref>内のタグとして、以下のタグを使用すること。(終了タグは省略) 1) 中西 秀彦ほか. 機械可読性組版の進展 XSPAとJATS10年間の歩み.

    第20回 情報プロフェッショナルシンポジウム. 情報科学技術協会. 2023, p.25-29. <ref id=“ref1”> <mixed-citation publication-type=“confproc”> <string-name> <surname> <given-names> <etal/> <article-title> <conf-name> <publisher-name> <year> <fpage> <lpage>
  14. 回答例3 <ref id=“ref1”> <mixed-citation publication-type=“confproc”> <string-name> <surname>中西</surname> <given-names>秀彦<given-names> <etal>ほか</etal>. <article-title>機械可読性組版の進展

    XSPAとJATS10年間の歩み</article-title>. <conf-name>第20回情報プロフェッショナルシンポジウム</conf-name>. <publisher-name>情報科学技術協会</publisher-name>. <year>2023</year>, p. <fpage>25</fpage>- <lpage>29</lpage>. 記法を正しく記録するためには、 タグの筆記順は必ずこの順番でなければならないことに注意。
  15. 回答例3 <ref id=“ref1”> <mixed-citation publication-type=“confproc”> <string-name> <surname>中西</surname> <given-names>秀彦<given-names> <etal>ほか</etal>. <article-title>機械可読性組版の進展

    XSPAとJATS10年間の歩み</article-title>. <conf-name>第20回情報プロフェッショナルシンポジウム</conf-name>. <publisher-name>情報科学技術協会</publisher-name>. <year>2023</year>, p. <fpage>25</fpage>- <lpage>29</lpage>. 記法を正しく記録するためには、 タグの筆記順は必ずこの順番でなければならないことに注意。 全角スペース!
  16. JATS XMLの作成 書誌情報XML 全文XML化よりは比較的簡易的に実装が可能。 Indesign上で要素タグを適用 XML変換機能などで吐き出し? 引用文献XML RefXpress(inera社)などが存在? AI生成(後述) 全文XML

    基本はWord原稿等から手作業でコピー&ペースト。 ウェブ執筆ツールなどにより変換が可能な場合も。 とはいえ自前での作成は厳しい。業者への外注もご検討ください。
  17. XSL FO 組版・レイアウトを表現するXML言語。 ページサイズや配置位置、フォントや文字 サイズなどがデータとして表現できる。 によってPDF化が可能 <fo:block> オブジェクト <fo:region-body> 版面のマージン等

    <fo:table> 表組情報 <fo:inline> 各行のテキスト <fo:footnote> 脚注など etc 用紙はA4です その下10mmの 場所にさらに「サ ブタイトル」と 24ptで書きます。 紙面の上から50mm、右 から10mmのところに、 太字の30ptで「タイト ル」と書いてください。
  18. XML組版の利点 • XML PDFはワンクリックで組版完了。(Word XMLに細かい調整・構造化は必要)。 • かつては30分~の時間をかけて手作業でIndesignで組版を実施 個別論文の組版のある程度の自動化が可能 • ワンソースマルチユース化によって、幅広いメディアへの同時提供が可能。

    • ご要望に応じてPMC搭載用のXMLスキーマへの変換 PMC登載なども柔軟に対応可能 J-STAGE登載用のJATS XMLをIndesignデータから作成する作業は消滅 • XML→PDFの変換が自動なので、雑誌ごとの細かい組版ルールの違いの見落としは少ない。 手作業に起因する事故は減少
  19. XML組版の課題 • DTP担当者にはXMLの高度な理解が必要。 • 完全にXMLを使いこなせる職員は弊社でも一部。職員ごとに作業時間・出来栄えにばらつきあり。 従業員の教育コストが高い • 1雑誌あたり数日単位での開発が必要。 • 開発時間は1論文あたりの組版作業時間の短縮で回収。

    • 単発ものでの採用は難しい(今でも単発はIndesign組版)。 雑誌ごとの変換プログラム作成のコストが高い • よくも悪くも杓子定規。「見栄え」のためにルールを無視することができない。 • ルールで決まっているレイアウトの場所に、必ずその情報が配置される。 • ルール設計次第では読みづらい紙面になってしまう恐れも・・・。 細かな組版指定はできない
  20. ここで生成AI! 与えられた指示を解釈し、それに最適な応答テキストを出力するAI。 ChatGPT以降爆発的な流行と技術発展。 生成AI 生成AIシステムへ の入力は日本語。 生成AIシステムは 与えられた日本語の 意味を“理解”する。 テキストの意味に

    応じたタグ付け 自動化の可能性! 入力「こんにちは。お元気ですか?」 ↓ 「こんにちは!元気ですよ。あなた はどうですか?」 入力「以下の引用文献テキストをJATS XML形式にタグ付けしてください」 ↓ 「〇〇〇〇〇!」
  21. 生成AIによるタグ付け処理 ・Microsoft社のクラウドプラットフォームに提供されるAIモデルAPI ・OpenAIリソースの応答をアプリケーション側から呼び出せる。 Azure OpenAI 大まかな JATS XML ※lxmlライブラリ mixed-citation

    mixed-citation mixed-citation mixed-citation 抽出 分割 AI処理 AI処理 AI処理 AI処理 タグ付け済書誌情報 タグ付け済書誌情報 タグ付け済書誌情報 タグ付け済書誌情報 統合 JATS XML あなたはXMLタグ付けの専門家です。[例1]~[例4]の入出力例に沿って、 以下の文献テキストにJATSバージョン1.1のXML文献タグ付けを適用 してください。結果のみを出力してください。[例1]
  22. 与えられた入力データ •中西明日輝・山本剛・山本久生・亀井賢二・楠健一(2012)中西印刷学会 報告 58: 15-36. AI変換プログラムの出力 •<ref id=“B3” xml:lang=“ja”> <mixed-citation

    publication-type=“journal” publication-format=“print”> <person-group person-group-type=“author”> <string-name name-style=“eastern”><surname>中西</surname> <given-names>明日輝</given-names></string-name>・ <string-name name-style=“eastern”><surname>山本</surname> <given-names>剛</given-names></string-name>・ <string-name name-style=“eastern”><surname>山本</surname> <given-names>久生</given-names></string-name>・ <string-name name-style=“eastern”><surname>亀井</surname> <given-names>賢二</given-names></string-name>・ <string-name name-style=“eastern”><surname>楠</surname> <given-names>健一</given-names></string-name> </person-group> (<year>2012</year>)<source>中西印刷学会報告</source> <volume>58</volume>: <fpage>15</fpage>–<lpage>36</lpage>. </mixed-citation> </ref> 著者名の姓名も 自動的に判別して 別々のタグに分類 元の書誌情報になかった 文献種別も「Journal」 に分類 変換例