Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
全文XML作成ツールの感想
Search
XSPA
April 26, 2021
Technology
0
420
全文XML作成ツールの感想
学術情報XML推進協議会セミナー
日時 :2021年4月26日(月曜日)
場所:WEB会議システム ZOOM
XSPA
April 26, 2021
Tweet
Share
More Decks by XSPA
See All by XSPA
JATS XML初心者実践セミナー_20260116_ Nakanishi Printing Company, Ltd
xspa2012
0
160
J-STAGEの全文XML化推進について_20260116_Japan Science and Technology Agency
xspa2012
0
66
即時オープンアクセス義務化とXML推進_20250729_ Nakanishi Printing Company, Ltd
xspa2012
0
110
J-STAGEの現況とメタデータの重要性_20250729_ Japan Science and Technology Agency
xspa2012
0
75
力任せ法_20250609_ Nakanishi Printing Company, Ltd
xspa2012
0
85
eXtyles3B2-JATS-XML_20250609_komiyama printing co.,Ltd..
xspa2012
0
78
OxygenとAntenna House Formatterで作る_20250609_Antenna House
xspa2012
0
62
即時OA時代のJATS XMLの重要性_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
66
AI活用_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
87
Other Decks in Technology
See All in Technology
「捨てる」を設計する
kubell_hr
0
250
SaaSに宿る21g
kanyamaguc
2
160
AWS Systems Managerのハイブリッドアクティベーションを使用したガバメントクラウド環境の統合管理
toru_kubota
0
160
Change Calendarで今はOK?を仕組みにする
tommy0124
1
100
Phase04_ターミナル基礎
overflowinc
0
2.3k
20260323_データ分析基盤でGeminiを使う話
1210yuichi0
0
180
スピンアウト講座01_GitHub管理
overflowinc
0
1.4k
VSCode中心だった自分がターミナル沼に入門した話
sanogemaru
0
600
MCPで決済に楽にする
mu7889yoon
0
110
Copilot 宇宙へ 〜生成AIで「専門データの壁」を壊す方法〜
nakasho
0
190
スピンアウト講座02_ファイル管理
overflowinc
0
1.3k
事例から紐解くSHIFT流QA支援 ~大規模プロジェクトの品質管理支援、QA組織立ち上げ~ / 20260320 Nozomu Koketsu
shift_evolve
PRO
0
140
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Everyday Curiosity
cassininazir
0
180
Side Projects
sachag
455
43k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
79
Claude Code のすすめ
schroneko
67
220k
Docker and Python
trallard
47
3.8k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
190
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
410
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
160
Optimizing for Happiness
mojombo
378
71k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.1k
Between Models and Reality
mayunak
2
240
Transcript
全文XML作成ツールの感想 永崎研宣(一般財団法人人文情報学研究所)
簡単な自己紹介 • XML歴23年 • 主にPHPやJavaScriptで XMLを操作・処理 • この数年はPython3/BeautifulSoupも。 • 直近の仕事:渋沢栄一ダイアリー
https://shibusawa-dlab.github.io/app1/ • TEI/XMLで記述した渋沢栄一日記をビジュアライゼーション。 • 永崎は、自動的な固有表現(地名人名)抽出⇒TEI/XMLタグ付けを担当 • ライティングの場合、この15年ほどは主にOxygen XML Editor • 主にTEI/XMLスキーマを利用。たまにJATS、KML等も。 • VSCodeのプラグインで利用することも • TEI Consortium 東アジア/日本語分科会の運営に従事 • https://github.com/TEI-EAJ/jp_guidelines/wiki
JATSとの関わり • J-STAGEで使い始めた。最初は書誌XMLのみ。 • 一応、NIHのサイトからスキーマをダウンロードして色々試してみた。 • 最初にXMLを引用した論文があり、ややこしそうだったので断念した。 • https://www.jstage.jst.go.jp/browse/jadh/-char/ja •
https://www.jstage.jst.go.jp/browse/jjadh/-char/en • JATSの開発に関わった Wendell Piez氏を日本デジタル・ ヒューマニティーズ学会のキーノートスピーチに招待し、JATS とTEIの関係について講演をしていただいた。 • J-STAGEで全文XML作成ツールが公開されたと知人から聞き、 やや誘われた感じだったのでちょっと試してみた。 • ⇒今回のお話につながりました。
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • 全文XML作成ツールのエディタがあまり開発に力を入れてない風だっ たので使うのを早々に断念。
• 「スキーマを読み取ってその箇所にふさわしいタグ候補を提示」「選択したテキ ストの前後に開始・終了タグを付ける」というごく基本的な機能がなかった • 最初、Webブラウザ上に表示されているXMLデータをOxygenに貼り付 けて作業したが、これだと画像のパスがずれてしまうことが後からわ かり、やり直しが発生した。みなさまもご注意ください。 • ローカル環境でOxygen XML Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • 主に、参考文献情報のタグ修正 • 自動的に著者名タイトルにタグ付けしてくれるが、かなりの確率で失敗し、著者 名もまともにタグ付けできないことが多いので大部分に手修正が必要だった。 • 画像タグもうまくつかないことがあったため手でタグを修正。 • その他、太字、イタリックなどの修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう これを一瞬でできるようにするのが XML技術の有用性の重要部分
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう J-STAGEサーバで使われているXSLTスタイル シート/CSSファイルを公開するとよいのでは J-STAGEのスキーマを作って公開を これを一瞬でできるようにするのが XML技術の有用性の重要部分 オンタイム変換でなくてもいいです
ついでのお願い? • もしかしたらどこかでやっているかもしれませんが… • スキーマのタグの解説を日本語化してあると非常に便利です。 • TEI/XMLではボランティアグループが週2~月1で集まって日本語化し ています。
もう一つお願い? • 全文XMLを作成したあと、そこそこきれいなPDFファイルを出 力できるようにしてほしい。 • (J-STAGE日本語論文用公式PDF変換ツールを配布するなど?) • JATS公式のものは日本語だと一応できそうだがデザイン的に… • ⇒今のところはアンテナハウスから買うしかない?
• ⇒買わなければ、XMLとは別途、ワードやインデザインでデザインし なければならず、二度手間。 • ⇒ビジネスを邪魔しないように、あくまでも簡素なものを。
詳しくはこちらに: • digitalnagasakiのブログ • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その1) • https://digitalnagasaki.hatenablog.com/entry/2020/12/26/053558 • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その2) •
https://digitalnagasaki.hatenablog.com/entry/2020/12/26/211751