Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
空間情報系オープンソースソフトウェア技術文書の国際化、 日本語ローカライゼーションの現状と課題
Search
Kayama Yoichi
November 12, 2024
Technology
0
1.4k
空間情報系オープンソースソフトウェア技術文書の国際化、 日本語ローカライゼーションの現状と課題
空間情報系オープンソースソフトウェア技術文書の国際化、日本語ローカライズの現状と課題
Kayama Yoichi
November 12, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
GeminiとNotebookLMによる金融実務の業務革新
abenben
0
240
ネットワーク保護はどう変わるのか?re:Inforce 2025最新アップデート解説
tokushun
0
130
Node-REDのFunctionノードでMCPサーバーの実装を試してみた / Node-RED × MCP 勉強会 vol.1
you
PRO
0
120
Wasm元年
askua
0
160
AIとともに進化するエンジニアリング / Engineering-Evolving-with-AI_final.pdf
lycorptech_jp
PRO
0
120
MySQL5.6から8.4へ 戦いの記録
kyoshidaxx
1
290
OpenHands🤲にContributeしてみた
kotauchisunsun
1
490
Should Our Project Join the CNCF? (Japanese Recap)
whywaita
PRO
0
280
自律的なスケーリング手法FASTにおけるVPoEとしてのアカウンタビリティ / dev-productivity-con-2025
yoshikiiida
0
200
AIの最新技術&テーマをつまんで紹介&フリートークするシリーズ #1 量子機械学習の入門
tkhresk
0
140
「良さそう」と「とても良い」の間には 「良さそうだがホンマか」がたくさんある / 2025.07.01 LLM品質Night
smiyawaki0820
1
410
WordPressから ヘッドレスCMSへ! Storyblokへの移行プロセス
nyata
0
260
Featured
See All Featured
How to Think Like a Performance Engineer
csswizardry
24
1.7k
Scaling GitHub
holman
459
140k
Site-Speed That Sticks
csswizardry
10
670
Rails Girls Zürich Keynote
gr2m
94
14k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
657
60k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.7k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
281
13k
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
35
2.4k
How STYLIGHT went responsive
nonsquared
100
5.6k
GraphQLの誤解/rethinking-graphql
sonatard
71
11k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
46
9.6k
Transcript
空間情報系オープンソースソフトウェア技術文書の国際化、 日本語ローカライゼーションの現状と課題 嘉山陽一 古橋大地
⚫ 一般社団法人 情報支援レスキュー隊(IT DART) 監事 ⚫ OSGeo.JP 運営委員 ⚫ OSGeo.org Charter member ⚫
地理情報システム学会(FOSS4G 分科会)会員 ⚫ QGIS 日本語GUI マニュアル翻訳 コーディネータ ⚫ 青山学院大学 非常勤講師 ⚫ Twitter ID @GsgeekO ⚫ Facebook https://www.facebook.com/yoichi.kayama LinkedIn https://www.linkedin.com/in/yoichikayama/ 自己紹介 2 嘉山陽一
はじめに 空間情報系オープンソースソフトウェアの増加 Internetの普及と発展 共同作業基盤の形成 世界的開発・利用コミュニティの形成 英語を利用した情報共有 一部の技術情報の日本語化(GRASS,QGIS,PostGIS 等) 3
課題 英語で情報取得でき,データやシステムの利用方法 がわかれば良い. しかしデジタルで地理空間情報をあつかうための体 系を理解するための基礎的なデータ群やソフトウェ ア群については日本語情報があったほうがいいの では?(体系を理解するための基本情報) 例 GDAL、PDAL, MDAL、PROJ 等 4
OSGeo.org サイト掲載プロジェクト 5 コミュニティプロジェクト 23 その他プロジェクト 30 計 53
OSGeo.org サイト掲載プロジェクト 日本語ローカライズ状況 6 総プロジェクト数 53 日本語化プロジェクト数 7 (GRASS, GeoServer, OSGeo Live, pgRouting,
PostGIS, QGIS Desktop, OSGeo4W )
QGISとPostGISの翻訳作業 7
OSGeo.org 8 2006年結成 地理空間に関する オープンソースソフト ウェアコミュニティ群 の調整組織
OSGeoLive 9 lubuntuベースの起動イ メージや仮想マシン. 多くの空間系オープンソー スシステムやデータがイン ストールされているので各 種空間系オープンソースシ ステムを試しに利用するた めにはとても便利.利用の
ためのドキュメントは多くの 言語でローカライズされて いる.
OSGeoLive 10 ドキュメントの翻訳作業に はWebLateが利用されてい る.簡単な解説と起動方法 の翻訳率は高いので各種 ソフトウェアの入門には便 利なリソースになっている.
internationalization(i18n)と localization(l10n) internationalization(i18n) プログラムや文書の多言語対応 localization(l10n) プログラムや文書のローカル言語化 (文字の翻訳、日付や数値表示形式の変更等) 11
国際化の対象項目 • 文字セット(標準の文字コードなど) • 文字の方向性(左から右へ、右から左へ、左に向かって上から下へ、他) • 文言 • フォント •
書式 ◦ 数値(小数点の文字、桁区切りの文字、区切る桁数など) ◦ 日時(年月日の表記の仕方、イスラム暦/グレゴリオ暦/ユダヤ暦/和暦など使用す る暦の違い、他) • 日時情報の時差 • 通貨情報 12
gettextを利用したi18nとl10n gettext GNUプロジェクトで作成された i18n とl10n用 のライブラリ 13
gettextを利用したi18nとl10n GNUプロジェクトによって作成された国際化と地域化のためのプログラムライブラリ。 いろいろなプログラム言語から利用できる。 プログラムを書く時にこのライブラリを利用し、国際化する部分をソースコードで指定した書き方を 行う。 そのソースコードに対してツールを動かすことで国際化する部分の別ファイル抽出と地域化用の 言語別ファイルを作成する。 地域化用個別ファイルの翻訳必要部分を翻訳テキストで修正し、それをコンパイルしたファイルを 成果物と一緒に配布すると個別実行環境では実行時のLOCALE環境変数を参照し、そこで指定 された地域の翻訳ファイルがある場合はその翻訳ファイルを利用してプログラムが実行される。
https://www.gnu.org/software/gettext/manual/gettext.html 14
gettextの利用例 python言語のプログラムソースでの利用例 # main.py def print_some_strings(): print("Hello world") print("This is
a translatable string") if __name__ == '__main__': print_some_strings() # main.py import gettext _ = gettext.gettext def print_some_strings(): print(_("Hello world")) print(_("This is a translatable string")) if __name__=='__main__': print_some_strings() gettext適用前のソースコード gettext適用修正後のソースコード
gettextの利用例 前頁のプログラムの実行結果 $ python main.py Hello world This is a
translatable string
gettextの利用例 $ pygettext.py -d base -o locales/base.pot src/main.py 前頁プログラムのファイル名が src/main.py
だとして以下のコマンドを 実行する そうすると locales/base.pot というファイルが生成される
locales/base.pot の中身 # SOME DESCRIPTIVE TITLE. # Copyright (C) YEAR
ORGANIZATION # FIRST AUTHOR <EMAIL@ADDRESS>, YEAR. # "Project-Id-Version: PACKAGE VERSION\n" 略 "Generated-By: pygettext.py 1.5\n" #: src/main.py:5 msgid "Hello world" msgstr "" #: src/main.py:6 msgid "This is a translatable string" msgstr ""
locales/base.pot の中身 # SOME DESCRIPTIVE TITLE. # Copyright (C) YEAR
ORGANIZATION # FIRST AUTHOR <EMAIL@ADDRESS>, YEAR. # "Project-Id-Version: PACKAGE VERSION\n" 略 "Generated-By: pygettext.py 1.5\n" #: src/main.py:5 msgid "Hello world" msgstr "" #: src/main.py:6 msgid "This is a translatable string" msgstr "" このファイルは翻訳作業を行うためのテンプレートファ イル。テンプレートファイルを各地域別にコピーしてそれ ぞれの地域の言語で msgstr ”” の箇所に msgid で示 されている文字の翻訳結果を記入していくことが localizationの作業になる。
前頁ファイルで日本語翻訳をや りたい場合 locale/base.potファイルを locale/en/LC_MESSAGES/base.po と locale/ja/LC_MESSAGES/base.po という名前でコ ピーする。 locale/ja/LC_MESSAGES/base.po で msgstr の行のダブルクオーテーションの間に
msgid で示されている文章の 翻訳文字列を記述する。 作業が終了したら locale/jp/LC_MESSAGES フォルダで msgfmt.py -o base.mo base というコマンドを実行して locale/ja/LC_MESSAGES/base.mo というファイルを生成する。 というのが翻訳作業の手順になる。
locale/ja/LC_MESSAGES/base.po の翻訳結果例 # My App. # Copyright (C) 2018 #
中略 "Content-Type: text/plain; charset=UTF-8\n" "Content-Transfer-Encoding: 8bit\n" "Generated-By: pygettext.py 1.5\n" #: main.py:5 msgid "Hello world" msgstr "こんにちは世界" #: main.py:6 msgid "This is a translatable string" msgstr "これは翻訳可能なテキストです"
None
None
gettextの仕組みでi18n,l10n用の情報を本体と 分離して管理できる poファイルを翻訳する作業が翻訳作業者の分担作業になる。これによりプログラ ム開発や修正の作業とlocalization(翻訳)作業を分離することができる。 gettextの仕組みは様々なプログラム言語で利用できるようになっているのでほと んどのプログラムのi18nとL10n作業はgettextの仕組みを利用している。 poファイルの翻訳作業用のツールはいろいろある。 WEB上でpoファイルを翻訳する仕組みもある。 gettextの仕組みはプログラムだけでなく、文書そのもののi18n,L10nにも利用され ている。
Sphinxと文書管理 元はPythonソースから技術文書を作成する仕組み reStructured textをソースとして WEB,PDF,Latex ,unix help,ePub等 多彩な出力が可能. gettextが対応しているので i18n,l10nが可能
25
QGISやGDALの技術文書はSphinxで 作成,管理
翻訳支援システム TransifexやWeblate WEB上での分担翻訳システム gettextで作成した po ファイルを利用可能 Github ActionでGithubと連動設定可能 27
QGISの日本語ローカライゼーショ ン QGIS Desktop コーディネーター 2名 レビューアー 4名 翻訳者 64名 QGIS Docs and Website
コーディネーター 6名 レビューアー 2名 翻訳者 90名 28
GDAL文書のローカライゼーション試行 GDAL ベクタ・ラスタデータ 利用のための抽象 ライブラリ. QGIS,ArcGISをはじ め多くのソフトウェ アで利用 29
GDAL技術文書はローカライズされていない 技術文書はプログ ラムソースコードと 同じリポジトリの doc というディレクト リ以下においてあ る.reStructured text で作成.Sphinxで管
理とビルドしている. 30
Sphinxの国際化機能を利用して日本語リソー スを作成.翻訳作業中 31 https://osgeo-jp.github.io/gdaldoc_ja/ tps://github.com/OSGeo-jp/gdal/blob/i18n/doc/so ce/locale/ja/LC_MESSAGES
日本語ローカライズ試行のためGDALのリポジ トリをfork .i18nというブランチを作成. 技術文書はプログ ラムソースコードと 同じリポジトリの doc というディレクト リ以下においてあ る.reStructured
text で作成.Sphinxで管 理とビルドしている. 32
poファイルをVSCodeで直接編集した後Sphinxで buildして日本語版HTMLを作成 VSCodeでGithub Copilotを利用できるよ うに設定しておくとGithub Copilotが翻 訳を支援してくれる。翻訳作業の効率 はこのやり方がいいかも。 33
ローカライゼーションの課題(1) ・GIS技術の体系基盤を担うようなソフトウェア文書 のローカライゼーションは技術体系普及のために あったほうがいい(GDAL,PDAL,PROJ等) 34
・オープンソースの場合ローカライズ作業メンバーの 確保や調整が必要. 個人的に作業開始を行うことも可能. コミュニティや学会が調整を行うといいのでは. 35 ローカライゼーションの課題(2)
・複数人で翻訳をやる場合翻訳作業の原則をつくり, 共有することが必要. ・日本語の文体,句読点,ロケール情報の統一. ・電子文書形式(reStructuredText, MarkDown等)の 規約,利用方法の統一 ・専門用語の共有( JSGI2.0 制定時の標準用語集) 36
ローカライゼーションの課題(3)
情報共有や議論ができる場所が必要 37 DiscordというBBSにGeo Community in Japanというグ ループを作成. #osgeoドキュ メント翻訳 と #qgisドキュメ
ント翻訳 という会議室を作 成. ここで日本語ローカライズ についての情報共有や意 見交換ができないか試行 中. 参加希望者は yoichi.kayama@gmail.com までご連絡下さい
ご清聴ありがとうございました 38