Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
全文XML作成ツールの感想
Search
XSPA
April 26, 2021
Technology
0
380
全文XML作成ツールの感想
学術情報XML推進協議会セミナー
日時 :2021年4月26日(月曜日)
場所:WEB会議システム ZOOM
XSPA
April 26, 2021
Tweet
Share
More Decks by XSPA
See All by XSPA
力任せ法_20250609_ Nakanishi Printing Company, Ltd
xspa2012
0
34
eXtyles3B2-JATS-XML_20250609_komiyama printing co.,Ltd..
xspa2012
0
27
OxygenとAntenna House Formatterで作る_20250609_Antenna House
xspa2012
0
22
即時OA時代のJATS XMLの重要性_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
20
AI活用_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
38
J-STAGEおよびJxivの現況
xspa2012
0
240
Chat GPTによるXML自動生成の可能性
xspa2012
0
330
デジタルアーカイブとしての電子ジャーナル
xspa2012
0
93
日本のデジタル辞書を支えるXMLフォーマット"LeXML"
xspa2012
0
470
Other Decks in Technology
See All in Technology
rubygem開発で鍛える設計力
joker1007
2
200
製造業からパッケージ製品まで、あらゆる領域をカバー!生成AIを利用したテストシナリオ生成 / 20250627 Suguru Ishii
shift_evolve
PRO
1
140
5min GuardDuty Extended Threat Detection EKS
takakuni
0
140
生成AI時代の開発組織・技術・プロセス 〜 ログラスの挑戦と考察 〜
itohiro73
0
200
AWS CDK 実践的アプローチ N選 / aws-cdk-practical-approaches
gotok365
6
750
Liquid Glass革新とSwiftUI/UIKit進化
fumiyasac0921
0
210
MySQL5.6から8.4へ 戦いの記録
kyoshidaxx
1
220
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
110
Snowflake Summit 2025 データエンジニアリング関連新機能紹介 / Snowflake Summit 2025 What's New about Data Engineering
tiltmax3
0
310
Observability infrastructure behind the trillion-messages scale Kafka platform
lycorptech_jp
PRO
0
140
Microsoft Build 2025 技術/製品動向 for Microsoft Startup Tech Community
torumakabe
2
280
地図も、未来も、オープンに。 〜OSGeo.JPとFOSS4Gのご紹介〜
wata909
0
110
Featured
See All Featured
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
138
34k
For a Future-Friendly Web
brad_frost
179
9.8k
Practical Orchestrator
shlominoach
188
11k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Side Projects
sachag
455
42k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Thoughts on Productivity
jonyablonski
69
4.7k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.3k
Code Review Best Practice
trishagee
68
18k
Build The Right Thing And Hit Your Dates
maggiecrowley
36
2.8k
Documentation Writing (for coders)
carmenintech
72
4.9k
Transcript
全文XML作成ツールの感想 永崎研宣(一般財団法人人文情報学研究所)
簡単な自己紹介 • XML歴23年 • 主にPHPやJavaScriptで XMLを操作・処理 • この数年はPython3/BeautifulSoupも。 • 直近の仕事:渋沢栄一ダイアリー
https://shibusawa-dlab.github.io/app1/ • TEI/XMLで記述した渋沢栄一日記をビジュアライゼーション。 • 永崎は、自動的な固有表現(地名人名)抽出⇒TEI/XMLタグ付けを担当 • ライティングの場合、この15年ほどは主にOxygen XML Editor • 主にTEI/XMLスキーマを利用。たまにJATS、KML等も。 • VSCodeのプラグインで利用することも • TEI Consortium 東アジア/日本語分科会の運営に従事 • https://github.com/TEI-EAJ/jp_guidelines/wiki
JATSとの関わり • J-STAGEで使い始めた。最初は書誌XMLのみ。 • 一応、NIHのサイトからスキーマをダウンロードして色々試してみた。 • 最初にXMLを引用した論文があり、ややこしそうだったので断念した。 • https://www.jstage.jst.go.jp/browse/jadh/-char/ja •
https://www.jstage.jst.go.jp/browse/jjadh/-char/en • JATSの開発に関わった Wendell Piez氏を日本デジタル・ ヒューマニティーズ学会のキーノートスピーチに招待し、JATS とTEIの関係について講演をしていただいた。 • J-STAGEで全文XML作成ツールが公開されたと知人から聞き、 やや誘われた感じだったのでちょっと試してみた。 • ⇒今回のお話につながりました。
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • 全文XML作成ツールのエディタがあまり開発に力を入れてない風だっ たので使うのを早々に断念。
• 「スキーマを読み取ってその箇所にふさわしいタグ候補を提示」「選択したテキ ストの前後に開始・終了タグを付ける」というごく基本的な機能がなかった • 最初、Webブラウザ上に表示されているXMLデータをOxygenに貼り付 けて作業したが、これだと画像のパスがずれてしまうことが後からわ かり、やり直しが発生した。みなさまもご注意ください。 • ローカル環境でOxygen XML Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • 主に、参考文献情報のタグ修正 • 自動的に著者名タイトルにタグ付けしてくれるが、かなりの確率で失敗し、著者 名もまともにタグ付けできないことが多いので大部分に手修正が必要だった。 • 画像タグもうまくつかないことがあったため手でタグを修正。 • その他、太字、イタリックなどの修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう これを一瞬でできるようにするのが XML技術の有用性の重要部分
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう J-STAGEサーバで使われているXSLTスタイル シート/CSSファイルを公開するとよいのでは J-STAGEのスキーマを作って公開を これを一瞬でできるようにするのが XML技術の有用性の重要部分 オンタイム変換でなくてもいいです
ついでのお願い? • もしかしたらどこかでやっているかもしれませんが… • スキーマのタグの解説を日本語化してあると非常に便利です。 • TEI/XMLではボランティアグループが週2~月1で集まって日本語化し ています。
もう一つお願い? • 全文XMLを作成したあと、そこそこきれいなPDFファイルを出 力できるようにしてほしい。 • (J-STAGE日本語論文用公式PDF変換ツールを配布するなど?) • JATS公式のものは日本語だと一応できそうだがデザイン的に… • ⇒今のところはアンテナハウスから買うしかない?
• ⇒買わなければ、XMLとは別途、ワードやインデザインでデザインし なければならず、二度手間。 • ⇒ビジネスを邪魔しないように、あくまでも簡素なものを。
詳しくはこちらに: • digitalnagasakiのブログ • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その1) • https://digitalnagasaki.hatenablog.com/entry/2020/12/26/053558 • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その2) •
https://digitalnagasaki.hatenablog.com/entry/2020/12/26/211751