Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
全文XML作成ツールの感想
Search
XSPA
April 26, 2021
Technology
0
390
全文XML作成ツールの感想
学術情報XML推進協議会セミナー
日時 :2021年4月26日(月曜日)
場所:WEB会議システム ZOOM
XSPA
April 26, 2021
Tweet
Share
More Decks by XSPA
See All by XSPA
即時オープンアクセス義務化とXML推進_20250729_ Nakanishi Printing Company, Ltd
xspa2012
0
71
J-STAGEの現況とメタデータの重要性_20250729_ Japan Science and Technology Agency
xspa2012
0
41
力任せ法_20250609_ Nakanishi Printing Company, Ltd
xspa2012
0
52
eXtyles3B2-JATS-XML_20250609_komiyama printing co.,Ltd..
xspa2012
0
44
OxygenとAntenna House Formatterで作る_20250609_Antenna House
xspa2012
0
34
即時OA時代のJATS XMLの重要性_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
38
AI活用_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
56
J-STAGEおよびJxivの現況
xspa2012
0
260
Chat GPTによるXML自動生成の可能性
xspa2012
0
360
Other Decks in Technology
See All in Technology
生成AI_その前_に_マルチクラウド時代の信頼できるデータを支えるSnowflakeメタデータ活用術.pdf
cm_mikami
0
120
Goに育てられ開発者向けセキュリティ事業を立ち上げた僕が今向き合う、AI × セキュリティの最前線 / Go Conference 2025
flatt_security
0
350
動画データのポテンシャルを引き出す! Databricks と AI活用への奮闘記(現在進行形)
databricksjapan
0
150
定期的な価値提供だけじゃない、スクラムが導くチームの共創化 / 20251004 Naoki Takahashi
shift_evolve
PRO
3
330
PLaMoの事後学習を支える技術 / PFN LLMセミナー
pfn
PRO
9
3.9k
AIが書いたコードをAIが検証する!自律的なモバイルアプリ開発の実現
henteko
1
350
20201008_ファインディ_品質意識を育てる役目は人かAIか___2_.pdf
findy_eventslides
1
510
成長自己責任時代のあるきかた/How to navigate the era of personal responsibility for growth
kwappa
3
280
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
2
5.5k
Where will it converge?
ibknadedeji
0
190
自作LLM Native GORM Pluginで実現する AI Agentバックテスト基盤構築
po3rin
2
270
Flaky Testへの現実解をGoのプロポーザルから考える | Go Conference 2025
upamune
1
440
Featured
See All Featured
Imperfection Machines: The Place of Print at Facebook
scottboms
269
13k
Unsuck your backbone
ammeep
671
58k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
252
21k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
248
1.3M
Balancing Empowerment & Direction
lara
4
680
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
32
2.2k
What's in a price? How to price your products and services
michaelherold
246
12k
Speed Design
sergeychernyshev
32
1.1k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.7k
VelocityConf: Rendering Performance Case Studies
addyosmani
332
24k
YesSQL, Process and Tooling at Scale
rocio
173
14k
Transcript
全文XML作成ツールの感想 永崎研宣(一般財団法人人文情報学研究所)
簡単な自己紹介 • XML歴23年 • 主にPHPやJavaScriptで XMLを操作・処理 • この数年はPython3/BeautifulSoupも。 • 直近の仕事:渋沢栄一ダイアリー
https://shibusawa-dlab.github.io/app1/ • TEI/XMLで記述した渋沢栄一日記をビジュアライゼーション。 • 永崎は、自動的な固有表現(地名人名)抽出⇒TEI/XMLタグ付けを担当 • ライティングの場合、この15年ほどは主にOxygen XML Editor • 主にTEI/XMLスキーマを利用。たまにJATS、KML等も。 • VSCodeのプラグインで利用することも • TEI Consortium 東アジア/日本語分科会の運営に従事 • https://github.com/TEI-EAJ/jp_guidelines/wiki
JATSとの関わり • J-STAGEで使い始めた。最初は書誌XMLのみ。 • 一応、NIHのサイトからスキーマをダウンロードして色々試してみた。 • 最初にXMLを引用した論文があり、ややこしそうだったので断念した。 • https://www.jstage.jst.go.jp/browse/jadh/-char/ja •
https://www.jstage.jst.go.jp/browse/jjadh/-char/en • JATSの開発に関わった Wendell Piez氏を日本デジタル・ ヒューマニティーズ学会のキーノートスピーチに招待し、JATS とTEIの関係について講演をしていただいた。 • J-STAGEで全文XML作成ツールが公開されたと知人から聞き、 やや誘われた感じだったのでちょっと試してみた。 • ⇒今回のお話につながりました。
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • 全文XML作成ツールのエディタがあまり開発に力を入れてない風だっ たので使うのを早々に断念。
• 「スキーマを読み取ってその箇所にふさわしいタグ候補を提示」「選択したテキ ストの前後に開始・終了タグを付ける」というごく基本的な機能がなかった • 最初、Webブラウザ上に表示されているXMLデータをOxygenに貼り付 けて作業したが、これだと画像のパスがずれてしまうことが後からわ かり、やり直しが発生した。みなさまもご注意ください。 • ローカル環境でOxygen XML Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • 主に、参考文献情報のタグ修正 • 自動的に著者名タイトルにタグ付けしてくれるが、かなりの確率で失敗し、著者 名もまともにタグ付けできないことが多いので大部分に手修正が必要だった。 • 画像タグもうまくつかないことがあったため手でタグを修正。 • その他、太字、イタリックなどの修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう これを一瞬でできるようにするのが XML技術の有用性の重要部分
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう J-STAGEサーバで使われているXSLTスタイル シート/CSSファイルを公開するとよいのでは J-STAGEのスキーマを作って公開を これを一瞬でできるようにするのが XML技術の有用性の重要部分 オンタイム変換でなくてもいいです
ついでのお願い? • もしかしたらどこかでやっているかもしれませんが… • スキーマのタグの解説を日本語化してあると非常に便利です。 • TEI/XMLではボランティアグループが週2~月1で集まって日本語化し ています。
もう一つお願い? • 全文XMLを作成したあと、そこそこきれいなPDFファイルを出 力できるようにしてほしい。 • (J-STAGE日本語論文用公式PDF変換ツールを配布するなど?) • JATS公式のものは日本語だと一応できそうだがデザイン的に… • ⇒今のところはアンテナハウスから買うしかない?
• ⇒買わなければ、XMLとは別途、ワードやインデザインでデザインし なければならず、二度手間。 • ⇒ビジネスを邪魔しないように、あくまでも簡素なものを。
詳しくはこちらに: • digitalnagasakiのブログ • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その1) • https://digitalnagasaki.hatenablog.com/entry/2020/12/26/053558 • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その2) •
https://digitalnagasaki.hatenablog.com/entry/2020/12/26/211751