Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
全文XML作成ツールの感想
Search
XSPA
April 26, 2021
Technology
0
390
全文XML作成ツールの感想
学術情報XML推進協議会セミナー
日時 :2021年4月26日(月曜日)
場所:WEB会議システム ZOOM
XSPA
April 26, 2021
Tweet
Share
More Decks by XSPA
See All by XSPA
即時オープンアクセス義務化とXML推進_20250729_ Nakanishi Printing Company, Ltd
xspa2012
0
40
J-STAGEの現況とメタデータの重要性_20250729_ Japan Science and Technology Agency
xspa2012
0
21
力任せ法_20250609_ Nakanishi Printing Company, Ltd
xspa2012
0
45
eXtyles3B2-JATS-XML_20250609_komiyama printing co.,Ltd..
xspa2012
0
38
OxygenとAntenna House Formatterで作る_20250609_Antenna House
xspa2012
0
30
即時OA時代のJATS XMLの重要性_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
28
AI活用_20250609_ Nakanishi Printing Company, Ltd.
xspa2012
0
48
J-STAGEおよびJxivの現況
xspa2012
0
250
Chat GPTによるXML自動生成の可能性
xspa2012
0
350
Other Decks in Technology
See All in Technology
開発と脆弱性と脆弱性診断についての話
su3158
1
1.1k
AIエージェントの開発に必須な「コンテキスト・エンジニアリング」とは何か──プロンプト・エンジニアリングとの違いを手がかりに考える
masayamoriofficial
0
360
あとはAIに任せて人間は自由に生きる
kentaro
3
1.1k
Postman MCP 関連機能アップデート / Postman MCP feature updates
yokawasa
0
140
Oracle Base Database Service:サービス概要のご紹介
oracle4engineer
PRO
2
20k
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
8.6k
Android Studio の 新しいAI機能を試してみよう / Try out the new AI features in Android Studio
yanzm
0
260
[CVPR2025論文読み会] Linguistics-aware Masked Image Modelingfor Self-supervised Scene Text Recognition
s_aiueo32
0
210
第4回 関東Kaggler会 [Training LLMs with Limited VRAM]
tascj
12
1.6k
【5分でわかる】セーフィー エンジニア向け会社紹介
safie_recruit
0
30k
EKS Pod Identity における推移的な session tags
z63d
1
200
イオン店舗一覧ページのパフォーマンスチューニング事例 / Performance tuning example for AEON store list page
aeonpeople
1
250
Featured
See All Featured
jQuery: Nuts, Bolts and Bling
dougneiner
64
7.9k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
30
9.6k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
1.1k
Building an army of robots
kneath
306
46k
[RailsConf 2023] Rails as a piece of cake
palkan
56
5.8k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
283
13k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
110
20k
Producing Creativity
orderedlist
PRO
347
40k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
46
7.6k
Building a Scalable Design System with Sketch
lauravandoore
462
33k
Being A Developer After 40
akosma
90
590k
Docker and Python
trallard
45
3.5k
Transcript
全文XML作成ツールの感想 永崎研宣(一般財団法人人文情報学研究所)
簡単な自己紹介 • XML歴23年 • 主にPHPやJavaScriptで XMLを操作・処理 • この数年はPython3/BeautifulSoupも。 • 直近の仕事:渋沢栄一ダイアリー
https://shibusawa-dlab.github.io/app1/ • TEI/XMLで記述した渋沢栄一日記をビジュアライゼーション。 • 永崎は、自動的な固有表現(地名人名)抽出⇒TEI/XMLタグ付けを担当 • ライティングの場合、この15年ほどは主にOxygen XML Editor • 主にTEI/XMLスキーマを利用。たまにJATS、KML等も。 • VSCodeのプラグインで利用することも • TEI Consortium 東アジア/日本語分科会の運営に従事 • https://github.com/TEI-EAJ/jp_guidelines/wiki
JATSとの関わり • J-STAGEで使い始めた。最初は書誌XMLのみ。 • 一応、NIHのサイトからスキーマをダウンロードして色々試してみた。 • 最初にXMLを引用した論文があり、ややこしそうだったので断念した。 • https://www.jstage.jst.go.jp/browse/jadh/-char/ja •
https://www.jstage.jst.go.jp/browse/jjadh/-char/en • JATSの開発に関わった Wendell Piez氏を日本デジタル・ ヒューマニティーズ学会のキーノートスピーチに招待し、JATS とTEIの関係について講演をしていただいた。 • J-STAGEで全文XML作成ツールが公開されたと知人から聞き、 やや誘われた感じだったのでちょっと試してみた。 • ⇒今回のお話につながりました。
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • 全文XML作成ツールのエディタがあまり開発に力を入れてない風だっ たので使うのを早々に断念。
• 「スキーマを読み取ってその箇所にふさわしいタグ候補を提示」「選択したテキ ストの前後に開始・終了タグを付ける」というごく基本的な機能がなかった • 最初、Webブラウザ上に表示されているXMLデータをOxygenに貼り付 けて作業したが、これだと画像のパスがずれてしまうことが後からわ かり、やり直しが発生した。みなさまもご注意ください。 • ローカル環境でOxygen XML Editor で細部を修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • 主に、参考文献情報のタグ修正 • 自動的に著者名タイトルにタグ付けしてくれるが、かなりの確率で失敗し、著者 名もまともにタグ付けできないことが多いので大部分に手修正が必要だった。 • 画像タグもうまくつかないことがあったため手でタグを修正。 • その他、太字、イタリックなどの修正 • J-STAGEにアップロード
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう これを一瞬でできるようにするのが XML技術の有用性の重要部分
全文XML作成ツールを含む作業の流れ • ワード上で論文にスタイル付与 • 全文XML作成ツールにアップロード • いったんまとめてダウンロード • ローカル環境でOxygen XML
Editor で細部を修正 • J-STAGEにアップロード • JATSスキーマではOKでもJ-STAGEにアップロードしたらエラーになることが • 細かな違いは色々ある模様 • テキスト表示の見た目が微妙に異なる…? • 全文XML作成ツールとJ-STAGEではスタイルシートが微妙に異なる • 複数のビブリオリスト非表示⇔複数のビブリオリスト表示 • 「ガイドライン」とも微妙に異なる • ⇒J-STAGEセンターに問い合わせれば確認してくださる • 30分ごとにアップロードして結果を確認しないといけない • ⇒アマチュアの片手間仕事としては無茶 • ⇒プロでも無駄に高額になってしまう J-STAGEサーバで使われているXSLTスタイル シート/CSSファイルを公開するとよいのでは J-STAGEのスキーマを作って公開を これを一瞬でできるようにするのが XML技術の有用性の重要部分 オンタイム変換でなくてもいいです
ついでのお願い? • もしかしたらどこかでやっているかもしれませんが… • スキーマのタグの解説を日本語化してあると非常に便利です。 • TEI/XMLではボランティアグループが週2~月1で集まって日本語化し ています。
もう一つお願い? • 全文XMLを作成したあと、そこそこきれいなPDFファイルを出 力できるようにしてほしい。 • (J-STAGE日本語論文用公式PDF変換ツールを配布するなど?) • JATS公式のものは日本語だと一応できそうだがデザイン的に… • ⇒今のところはアンテナハウスから買うしかない?
• ⇒買わなければ、XMLとは別途、ワードやインデザインでデザインし なければならず、二度手間。 • ⇒ビジネスを邪魔しないように、あくまでも簡素なものを。
詳しくはこちらに: • digitalnagasakiのブログ • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その1) • https://digitalnagasaki.hatenablog.com/entry/2020/12/26/053558 • 新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その2) •
https://digitalnagasaki.hatenablog.com/entry/2020/12/26/211751