Upgrade to Pro — share decks privately, control downloads, hide ads and more …

なぜXMLオンラインジャーナルは有利なのか -機械可読性の視点から- / 20140318-x...

XSPA
May 03, 2015

なぜXMLオンラインジャーナルは有利なのか -機械可読性の視点から- / 20140318-xml-nakanishi

J-STAGE利用学協会意見交換会、学術情報XML推進協議会(XSPA)セミナー
日付: 2014年3月18日 (火曜日)
場所: 京都リサーチパーク AV会議室 (1号館4F)

XSPA

May 03, 2015
Tweet

More Decks by XSPA

Other Decks in Technology

Transcript

  1. 学術情報 XML 推進協議会2014 学術情報 XML  推進協議会 •  学術情報の XML  製作・流通を推進するた

    め結成 – 2012/6/28   – 学会、印刷会社、JST、学識者 – 会長:  時実 象一(愛知大学教授) •  XML  普及のための活動 – XML  普及のための広報・宣伝 – 学会・印刷会社への情報提供・教育 – JATS  の改良のための研究・助言 2
  2. 学術情報 XML 推進協議会2014 PDFオンラインジャーナルの限界 •  現在はPDFが電子出版の中心 –  J-STAGE2まで •  PDFは紙の本を画面に移し替えただけ

    –  画面では見にくい 2段組など –  プリントアウトして読む –  画面中心の時代に適合しない •  マシンリーダビリティに弱い –  PDF最大の欠点 –  人間には読みやすいが検索・再利用しにく い 10
  3. 学術情報 XML 推進協議会2014 マシンリーダービリティ •  機械可読性(Machine  Readability  )   – 人間ではなく機械に読み取ってもらいやすい

    – 機械で利用しやすい •  インターネット時代の情報流通の要 – 多くの情報の中から適した情報を発見するのは 機械(コンピュータ) – 情報を加工統合するのもコンピュータ 11
  4. 学術情報 XML 推進協議会2014 幅広く利用されるXML   •  eXtensible  Markup  Language  

    – 現在電子文書の中心 – データ交換に有利 •  メタデータ記述 (RDF)   •  電子ジャーナル •  電子書籍 (XHTML,  EPUB)   •  MicrosoX  Office  docx  xlsxの拡張子を持つもの   19
  5. 学術情報 XML 推進協議会2014 XMLの実例 •  例 <社員情報>      <社員番号>1000</社員番号>

         <氏名>          <姓>田中</姓>          <名>次郎</名>      </氏名>      <部署>総務</部署>   </社員情報>   20
  6. 学術情報 XML 推進協議会2014 DTD   •  Document  Type  DefiniEon  

    – SGML,  XML  において、文書構造 (文書型)  を定義 するスキーマ – 具体的には •  要素 (element)   •  属性 (a_ribute)   – などを定義する 21 学術情報 XML 推進協議会講演
  7. 学術情報 XML 推進協議会2014 JATS   •  NLM  DTD    

    – 学術雑誌における XML  の DTD  として開発 (2002)   •  Journal  ArEcle  Tag  Suite  (JATS)   – PubMed  Central  改良計画 (NCBI)NLM  DTD  3.1   (draX)  が NISO  に移行 – JATS  version  0.4   •  トライアルが 2011/9/30  で終了 – version  1.0  は 2012/8/9 に ANSI  承認、公開 22
  8. 学術情報 XML 推進協議会2014 XMLと構造化 •  それぞれの文の中の位置づけを文書に与え る。 – 人間は「林」は文脈の中で初めて人の名前なの か、木の集合なのかを判断できる。 – <surname>林</surname>

      – とすることで、文脈に依存せず、名前であること がわかる – <affiliaEon>林</affiliaEon>  だと所属 •  コンピュータが容易に判別して分析可能 24
  9. 学術情報 XML 推進協議会2014 構造化のメリット •  表現に依存しない。 – どういう表現で見るかは見るデバイスの問題 •  PC   or

       タブレット or    スマホ – 読む人の好みによってかえればよい •  再利用しやすい – タイトルだけ抜き出して目次・索引 – Fund  tagなどのあらたな付加価値  •  このあとの時実講演にて例示 •  検索性の向上 – 検索される⇒読まれる⇒引用される   25
  10. 学術情報 XML 推進協議会2014 J-­‐STAGE   •  新バージョン 2012/5  に公開 • 

    JATS  0.4  を正式サポート •  JATS  1.0  (2.25見解) – J-­‐STAGEでは、順次JATSのサポートを拡大の方針 – JATS1.0についてはバージョンへの準拠よりもむし ろ対応タグの拡充 – 優先度の高いタグや表示仕様等について、協議 会の要望・意見をいれて準備したい。 26
  11. 学術情報 XML 推進協議会2014 J-­‐STAGEでのXML公開(full-­‐J) 29 •  英文誌 27誌   –  ACTA

     HISTOCHEMICA  ET  CYTOCHEMICA   –  Anthropological  Science   –  Biological  and  PharmaceuEcal  BulleEn   –  Breeding  Science   –  Cell  Structure  and  FuncEon   –  Chemical  and  PharmaceuEcal  BulleEn   –  Current  Herpetology   –  Experimental  Animals   –  Food  Science  and  Technology  Research   –  Food  Safety   –  Genes  &  GeneEc  Systems   –  Hypertension  Research  in  Pregnancy   –  Industrial  Health   –  ISIJ  InternaEonal   –  JAMSTEC  Report  of  Research  and  Development   –  Journal  of  Applied  Glycoscience   –  Journal  of  the  Japanese  Society  for  HorEcultural   Science   –  Journal  of  the  Mass  Spectrometry  Society  of   Japan   –  Journal  of  OccupaEonal  Health   –  Journal  of  PesEcide  Science   –  Journal  of  Toxicologic  Pathology   –  KONA  Powder  and  ParEcle  Journal   –  Microbes  and  Environments   –  Mass  Spectrometry   –  Proceedings  of  the  Japan  Academy,  Series  B   –  The  Tohoku  Journal  of  Experimental  Medicine   –  Tropical  Medicine  and  Health •  和文誌 10誌 –  育種学研究 –  産業衛生学雑誌 –  情報管理 –  鉄と鋼 –  日本看護科学会誌 –  日本消化器外科学会雑誌 –  日本食品保蔵科学会誌 –  行動医学研究 –  日本官能評価学会誌 –  日本内分泌・甲状腺外科学会雑誌 •  その他、書誌のみXML(本文はPDF)(Bib-­‐JXML 誌)が約250誌 •  2/25現在 急拡大中 
  12. 学術情報 XML 推進協議会2014 今はまだメリットがないと言われる方へ
 •  早く始めるほど、XMLデータが蓄積できる。 –  XMLはあとから遡って作成できない。 –  XML対応ソフトができてからの作成では蓄積がない

    •  オープンアクセスは紙では難しい –  学会会費は本の雑誌の対価とは思われていない –  購読料モデルから投稿料モデルへの変化 •  日本語で発表した論文でもJ-­‐STAGEでは海外から読ま れている。 –  翻訳ソフトの発達 XMLであればこそ利用可能 •  剽窃・盗用発見ソフト(Cross  Checkなど)もXMLであれば こそ利用可能 •  XMLはもはや理系英文誌だけのものではない 30
  13. 学術情報 XML 推進協議会2014 オンライン優先への製作法進化 •  1990年以前 –  活版、手動写植、電算写植 再利用不可能 –  電算写植の場合は文字のみ再利用

    –  紙に出力する以上の発想なし  •  1990年以後 –  DTPの利用  PageMaker  QuarkXpress –  レイアウト優先であるが One-­‐Source  MulEuseを意識 •  2000年以後  –  SGML  XMLとの同時組版  FrameMaker      3B2 –  オンラインでの使用前提 •  2010年以後 –  XML優位組版 各種 XMLパーサ AH  Forma_erなどの 自動組版 –  オンラインが第一選択
  14. 学術情報 XML 推進協議会2014 OLJ  出版編集と機械可読性 •  字送り・ハイフネーション処理 – XML文書内にユニコードの&#x00A0;(ノーブレーク スペース)や&#x200D;(幅なし接続子)を適宜入れ て調整する

    <japanese>窒素固定は酸素感受性の酵素ニトロゲナーゼがN<sub>2</ sub>をア&#x200D;ン&#x200D;モニアに還元する反応であり、多くの遺 伝子がこの生体反応に関わっている。今回我々は嫌気条件下でヘテロシ &#x200D;ス&#x200D;ト&#x200D;を形&#x200D;成&#x200D;せずに窒 素固定を行う糸状性シアノバクテリア<i>Leptolyngbya boryana</i>にお いて、転写制御タンパク質PatBが
  15. 学術情報 XML 推進協議会2014 学術情報XML推進協議会として •  人間可読性と機械可読性の両立 – 喫緊の課題解決 •  様々な技術的問題点の解決 – ソフトウェアの開発促進

    – JATSの改訂への提案   •  印刷会社や学協会のXML対応を強化するこ とで、世界への発信強化 – JATS規格の翻訳 – XML作成技法の普及 39
  16. 学術情報 XML 推進協議会2014 JATS  1.0 •  以下を提案 – グループ著者の多言語化のための <collab-­‐ alternaEves>

     の導入 (◦)   – ふりがな記述を可能に (×) ⇒1.1で可能に   – 非グレゴリー暦 (和暦、イスラム暦など)  の記述方 法の導入 (◦)   – 引用文献の多言語化のための <ref-­‐alternaEves>   の導入 (×)   40
  17. 学術情報 XML 推進協議会2014 日本からの発信の重要性 •  アメリカ・ヨーロッパ・アジアという3誌 体制 –  American Journal,European Journal – 

    そして Asian Journal –  このままではアジア代表誌がChinese Journal になりかねない •  海外でRejectされてアイデアだけが漏洩し ないか •  日本で日本の税金を使った研究成果を海外 出版社に金を払って読むのはおかしい •  Open Access と 国産ジャーナルの推進 • なにはともあれXML 42
  18. 学術情報 XML 推進協議会2014 学術情報XML推進協議会 •  印刷会社や学協会のXML対応を強化する ことで、世界への発信強化 –  技術囲い込み戦略からの脱皮 – 

    競争相手は国内ではなく、インドから世界 へ •  日本語のXML規格を世界水準へ •  加盟をお願いします –  年会費がたったの50,000円 –  学協会 無料!
 43