Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
全文XML作成ツールの感想
Search
XSPA
April 26, 2021
Technology
440
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
全文XML作成ツールの感想
学術情報XML推進協議会セミナー
日時 :2021年4月26日(月曜日)
場所:WEB会議システム ZOOM
XSPA
April 26, 2021
More Decks by XSPA
See All by XSPA
JATS XML初心者実践セミナー_20260116_ Nakanishi Printing Company, Ltd
xspa2012
0
220
J-STAGEの全文XML化推進について_20260116_Japan Science and Technology Agency
xspa2012
0
110
即時オープンアクセス義務化とXML推進_20250729_ Nakanishi Printing Company, Ltd
xspa2012
0
130
J-STAGEの現況とメタデータの重要性_20250729_ Japan Science and Technology Agency
xspa2012
0
120
力任せ法_20250609_ Nakanishi Printing Company, Ltd
xspa2012
0
100
eXtyles3B2-JATS-XML_20250609_komiyama printing co.,Ltd..
xspa2012
0
95
OxygenとAntenna House Formatterで作る_20250609_Antenna House
xspa2012
0
75
即時OA時代のJATS XMLの重要性_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
73
AI活用_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
110
Other Decks in Technology
See All in Technology
200個のGitHubリポジトリを横断調査したかった
icck
0
130
【NRUG vol.18】KubernetesにおけるNew Relicデータ取得量削減の考え方
nrug_member
0
110
"何を作るか"を任される エンジニアは、どう育つのか
yutaokafuji
1
680
AIエージェントが名古屋の猛暑からあなたを守る
happysamurai294
0
120
エンジニアリング戦略の作り方 / Crafting Engineering Strategy
iwashi86
21
6.9k
【セミナー資料】Claude Code をセキュアに使うための考え方と設定の勘どころ / Claude Code Webinar 20260616
masahirokawahara
2
310
Chainlitで作るお手軽チャットUI
ynt0485
0
240
SONiCで構築・運用する生成AI向けパブリッククラウドネットワーク ~実装編~
sonic
0
210
手塩にかけりゃいいってもんじゃない
ming_ayami
0
570
RAG を使わないという選択肢
tatsutaka
1
230
マルチアカウント環境での コーディングエージェントを使った障害調査が大変なので AIエージェントにReadOnly権限を付与してみた / ReadOnly AI Agents for Multi-Account AWS Incident Response
yamaguchitk333
2
100
やさしいA2A入門
minorun365
PRO
12
1.9k
Featured
See All Featured
Practical Orchestrator
shlominoach
191
11k
Building Applications with DynamoDB
mza
96
7.1k
Ethics towards AI in product and experience design
skipperchong
2
310
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
610
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
210
Bash Introduction
62gerente
615
220k
What’s in a name? Adding method to the madness
productmarketing
PRO
24
4.1k
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
330
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
840
GraphQLの誤解/rethinking-graphql
sonatard
75
12k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
340
Speed Design
sergeychernyshev
33
1.8k
Transcript
全文XML作成ツールの感想 永崎研宣(一般財団法人人文情報学研究所)
簡単な自己紹介 • XML歴23年 • 主にPHPやJavaScriptで XMLを操作・処理 • この数年はPython3/BeautifulSoupも。 • 直近の仕事:渋沢栄一ダイアリー
https://shibusawa-dlab.github.io/app1/ • TEI/XMLで記述した渋沢栄一日記をビジュアライゼーション。 • 永崎は、自動的な固有表現(地名人名)抽出⇒TEI/XMLタグ付けを担当 • ライティングの場合、この15年ほどは主にOxygen XML Editor • 主にTEI/XMLスキーマを利用。たまにJATS、KML等も。 • VSCodeのプラグインで利用することも • TEI Consortium 東アジア/日本語分科会の運営に従事 • https://github.com/TEI-EAJ/jp_guidelines/wiki
JATSとの関わり • J-STAGEで使い始めた。最初は書誌XMLのみ。 • 一応、NIHのサイトからスキーマをダウンロードして色々試してみた。 • 最初にXMLを引用した論文があり、ややこしそうだったので断念した。 • https://www.jstage.jst.go.jp/browse/jadh/-char/ja •
https://www.jstage.jst.go.jp/browse/jjadh/-char/en • JATSの開発に関わった Wendell Piez氏を日本デジタル・ ヒューマニティーズ学会のキーノートスピーチに招待し、JATS とTEIの関係について講演をしていただいた。 • J-STAGEで全文XML作成ツールが公開されたと知人から聞き、 やや誘われた感じだったのでちょっと試してみた。 • ⇒今回のお話につながりました。
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • 全文XML作成ツールのエディタがあまり開発に力を入れてない風だっ たので使うのを早々に断念。
• 「スキーマを読み取ってその箇所にふさわしいタグ候補を提示」「選択したテキ ストの前後に開始・終了タグを付ける」というごく基本的な機能がなかった • 最初、Webブラウザ上に表示されているXMLデータをOxygenに貼り付 けて作業したが、これだと画像のパスがずれてしまうことが後からわ かり、やり直しが発生した。みなさまもご注意ください。 • ローカル環境でOxygen XML Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • 主に、参考文献情報のタグ修正 • 自動的に著者名タイトルにタグ付けしてくれるが、かなりの確率で失敗し、著者 名もまともにタグ付けできないことが多いので大部分に手修正が必要だった。 • 画像タグもうまくつかないことがあったため手でタグを修正。 • その他、太字、イタリックなどの修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう これを一瞬でできるようにするのが XML技術の有用性の重要部分
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう J-STAGEサーバで使われているXSLTスタイル シート/CSSファイルを公開するとよいのでは J-STAGEのスキーマを作って公開を これを一瞬でできるようにするのが XML技術の有用性の重要部分 オンタイム変換でなくてもいいです
ついでのお願い? • もしかしたらどこかでやっているかもしれませんが… • スキーマのタグの解説を日本語化してあると非常に便利です。 • TEI/XMLではボランティアグループが週2~月1で集まって日本語化し ています。
もう一つお願い? • 全文XMLを作成したあと、そこそこきれいなPDFファイルを出 力できるようにしてほしい。 • (J-STAGE日本語論文用公式PDF変換ツールを配布するなど?) • JATS公式のものは日本語だと一応できそうだがデザイン的に… • ⇒今のところはアンテナハウスから買うしかない?
• ⇒買わなければ、XMLとは別途、ワードやインデザインでデザインし なければならず、二度手間。 • ⇒ビジネスを邪魔しないように、あくまでも簡素なものを。
詳しくはこちらに: • digitalnagasakiのブログ • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その1) • https://digitalnagasaki.hatenablog.com/entry/2020/12/26/053558 • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その2) •
https://digitalnagasaki.hatenablog.com/entry/2020/12/26/211751