$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
空間情報系オープンソースソフトウェア技術文書の国際化、 日本語ローカライゼーションの現状と課題
Search
Kayama Yoichi
November 12, 2024
Technology
0
2.1k
空間情報系オープンソースソフトウェア技術文書の国際化、 日本語ローカライゼーションの現状と課題
空間情報系オープンソースソフトウェア技術文書の国際化、日本語ローカライズの現状と課題
Kayama Yoichi
November 12, 2024
Tweet
Share
Other Decks in Technology
See All in Technology
AIBuildersDay_track_A_iidaxs
iidaxs
4
1.4k
【開発を止めるな】機能追加と並行して進めるアーキテクチャ改善/Keep Shipping: Architecture Improvements Without Pausing Dev
bitkey
PRO
1
130
LayerX QA Night#1
koyaman2
0
260
AR Guitar: Expanding Guitar Performance from a Live House to Urban Space
ekito_station
0
230
SQLだけでマイグレーションしたい!
makki_d
0
1.2k
AWSに革命を起こすかもしれない新サービス・アップデートについてのお話
yama3133
0
510
Amazon Quick Suite で始める手軽な AI エージェント
shimy
1
1.9k
マイクロサービスへの5年間 ぶっちゃけ何をしてどうなったか
joker1007
21
8.2k
半年で、AIゼロ知識から AI中心開発組織の変革担当に至るまで
rfdnxbro
0
140
Amazon Connect アップデート! AIエージェントにMCPツールを設定してみた!
ysuzuki
0
140
20251222_サンフランシスコサバイバル術
ponponmikankan
2
140
Amazon Bedrock Knowledge Bases × メタデータ活用で実現する検証可能な RAG 設計
tomoaki25
6
2.4k
Featured
See All Featured
Are puppies a ranking factor?
jonoalderson
0
2.4k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
74
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
200
Agile that works and the tools we love
rasmusluckow
331
21k
We Are The Robots
honzajavorek
0
120
Writing Fast Ruby
sferik
630
62k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
Digital Ethics as a Driver of Design Innovation
axbom
PRO
0
130
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
51
Transcript
空間情報系オープンソースソフトウェア技術文書の国際化、 日本語ローカライゼーションの現状と課題 嘉山陽一 古橋大地
⚫ 一般社団法人 情報支援レスキュー隊(IT DART) 監事 ⚫ OSGeo.JP 運営委員 ⚫ OSGeo.org Charter member ⚫
地理情報システム学会(FOSS4G 分科会)会員 ⚫ QGIS 日本語GUI マニュアル翻訳 コーディネータ ⚫ 青山学院大学 非常勤講師 ⚫ Twitter ID @GsgeekO ⚫ Facebook https://www.facebook.com/yoichi.kayama LinkedIn https://www.linkedin.com/in/yoichikayama/ 自己紹介 2 嘉山陽一
はじめに 空間情報系オープンソースソフトウェアの増加 Internetの普及と発展 共同作業基盤の形成 世界的開発・利用コミュニティの形成 英語を利用した情報共有 一部の技術情報の日本語化(GRASS,QGIS,PostGIS 等) 3
課題 英語で情報取得でき,データやシステムの利用方法 がわかれば良い. しかしデジタルで地理空間情報をあつかうための体 系を理解するための基礎的なデータ群やソフトウェ ア群については日本語情報があったほうがいいの では?(体系を理解するための基本情報) 例 GDAL、PDAL, MDAL、PROJ 等 4
OSGeo.org サイト掲載プロジェクト 5 コミュニティプロジェクト 23 その他プロジェクト 30 計 53
OSGeo.org サイト掲載プロジェクト 日本語ローカライズ状況 6 総プロジェクト数 53 日本語化プロジェクト数 7 (GRASS, GeoServer, OSGeo Live, pgRouting,
PostGIS, QGIS Desktop, OSGeo4W )
QGISとPostGISの翻訳作業 7
OSGeo.org 8 2006年結成 地理空間に関する オープンソースソフト ウェアコミュニティ群 の調整組織
OSGeoLive 9 lubuntuベースの起動イ メージや仮想マシン. 多くの空間系オープンソー スシステムやデータがイン ストールされているので各 種空間系オープンソースシ ステムを試しに利用するた めにはとても便利.利用の
ためのドキュメントは多くの 言語でローカライズされて いる.
OSGeoLive 10 ドキュメントの翻訳作業に はWebLateが利用されてい る.簡単な解説と起動方法 の翻訳率は高いので各種 ソフトウェアの入門には便 利なリソースになっている.
internationalization(i18n)と localization(l10n) internationalization(i18n) プログラムや文書の多言語対応 localization(l10n) プログラムや文書のローカル言語化 (文字の翻訳、日付や数値表示形式の変更等) 11
国際化の対象項目 • 文字セット(標準の文字コードなど) • 文字の方向性(左から右へ、右から左へ、左に向かって上から下へ、他) • 文言 • フォント •
書式 ◦ 数値(小数点の文字、桁区切りの文字、区切る桁数など) ◦ 日時(年月日の表記の仕方、イスラム暦/グレゴリオ暦/ユダヤ暦/和暦など使用す る暦の違い、他) • 日時情報の時差 • 通貨情報 12
gettextを利用したi18nとl10n gettext GNUプロジェクトで作成された i18n とl10n用 のライブラリ 13
gettextを利用したi18nとl10n GNUプロジェクトによって作成された国際化と地域化のためのプログラムライブラリ。 いろいろなプログラム言語から利用できる。 プログラムを書く時にこのライブラリを利用し、国際化する部分をソースコードで指定した書き方を 行う。 そのソースコードに対してツールを動かすことで国際化する部分の別ファイル抽出と地域化用の 言語別ファイルを作成する。 地域化用個別ファイルの翻訳必要部分を翻訳テキストで修正し、それをコンパイルしたファイルを 成果物と一緒に配布すると個別実行環境では実行時のLOCALE環境変数を参照し、そこで指定 された地域の翻訳ファイルがある場合はその翻訳ファイルを利用してプログラムが実行される。
https://www.gnu.org/software/gettext/manual/gettext.html 14
gettextの利用例 python言語のプログラムソースでの利用例 # main.py def print_some_strings(): print("Hello world") print("This is
a translatable string") if __name__ == '__main__': print_some_strings() # main.py import gettext _ = gettext.gettext def print_some_strings(): print(_("Hello world")) print(_("This is a translatable string")) if __name__=='__main__': print_some_strings() gettext適用前のソースコード gettext適用修正後のソースコード
gettextの利用例 前頁のプログラムの実行結果 $ python main.py Hello world This is a
translatable string
gettextの利用例 $ pygettext.py -d base -o locales/base.pot src/main.py 前頁プログラムのファイル名が src/main.py
だとして以下のコマンドを 実行する そうすると locales/base.pot というファイルが生成される
locales/base.pot の中身 # SOME DESCRIPTIVE TITLE. # Copyright (C) YEAR
ORGANIZATION # FIRST AUTHOR <EMAIL@ADDRESS>, YEAR. # "Project-Id-Version: PACKAGE VERSION\n" 略 "Generated-By: pygettext.py 1.5\n" #: src/main.py:5 msgid "Hello world" msgstr "" #: src/main.py:6 msgid "This is a translatable string" msgstr ""
locales/base.pot の中身 # SOME DESCRIPTIVE TITLE. # Copyright (C) YEAR
ORGANIZATION # FIRST AUTHOR <EMAIL@ADDRESS>, YEAR. # "Project-Id-Version: PACKAGE VERSION\n" 略 "Generated-By: pygettext.py 1.5\n" #: src/main.py:5 msgid "Hello world" msgstr "" #: src/main.py:6 msgid "This is a translatable string" msgstr "" このファイルは翻訳作業を行うためのテンプレートファ イル。テンプレートファイルを各地域別にコピーしてそれ ぞれの地域の言語で msgstr ”” の箇所に msgid で示 されている文字の翻訳結果を記入していくことが localizationの作業になる。
前頁ファイルで日本語翻訳をや りたい場合 locale/base.potファイルを locale/en/LC_MESSAGES/base.po と locale/ja/LC_MESSAGES/base.po という名前でコ ピーする。 locale/ja/LC_MESSAGES/base.po で msgstr の行のダブルクオーテーションの間に
msgid で示されている文章の 翻訳文字列を記述する。 作業が終了したら locale/jp/LC_MESSAGES フォルダで msgfmt.py -o base.mo base というコマンドを実行して locale/ja/LC_MESSAGES/base.mo というファイルを生成する。 というのが翻訳作業の手順になる。
locale/ja/LC_MESSAGES/base.po の翻訳結果例 # My App. # Copyright (C) 2018 #
中略 "Content-Type: text/plain; charset=UTF-8\n" "Content-Transfer-Encoding: 8bit\n" "Generated-By: pygettext.py 1.5\n" #: main.py:5 msgid "Hello world" msgstr "こんにちは世界" #: main.py:6 msgid "This is a translatable string" msgstr "これは翻訳可能なテキストです"
None
None
gettextの仕組みでi18n,l10n用の情報を本体と 分離して管理できる poファイルを翻訳する作業が翻訳作業者の分担作業になる。これによりプログラ ム開発や修正の作業とlocalization(翻訳)作業を分離することができる。 gettextの仕組みは様々なプログラム言語で利用できるようになっているのでほと んどのプログラムのi18nとL10n作業はgettextの仕組みを利用している。 poファイルの翻訳作業用のツールはいろいろある。 WEB上でpoファイルを翻訳する仕組みもある。 gettextの仕組みはプログラムだけでなく、文書そのもののi18n,L10nにも利用され ている。
Sphinxと文書管理 元はPythonソースから技術文書を作成する仕組み reStructured textをソースとして WEB,PDF,Latex ,unix help,ePub等 多彩な出力が可能. gettextが対応しているので i18n,l10nが可能
25
QGISやGDALの技術文書はSphinxで 作成,管理
翻訳支援システム TransifexやWeblate WEB上での分担翻訳システム gettextで作成した po ファイルを利用可能 Github ActionでGithubと連動設定可能 27
QGISの日本語ローカライゼーショ ン QGIS Desktop コーディネーター 2名 レビューアー 4名 翻訳者 64名 QGIS Docs and Website
コーディネーター 6名 レビューアー 2名 翻訳者 90名 28
GDAL文書のローカライゼーション試行 GDAL ベクタ・ラスタデータ 利用のための抽象 ライブラリ. QGIS,ArcGISをはじ め多くのソフトウェ アで利用 29
GDAL技術文書はローカライズされていない 技術文書はプログ ラムソースコードと 同じリポジトリの doc というディレクト リ以下においてあ る.reStructured text で作成.Sphinxで管
理とビルドしている. 30
Sphinxの国際化機能を利用して日本語リソー スを作成.翻訳作業中 31 https://osgeo-jp.github.io/gdaldoc_ja/ tps://github.com/OSGeo-jp/gdal/blob/i18n/doc/so ce/locale/ja/LC_MESSAGES
日本語ローカライズ試行のためGDALのリポジ トリをfork .i18nというブランチを作成. 技術文書はプログ ラムソースコードと 同じリポジトリの doc というディレクト リ以下においてあ る.reStructured
text で作成.Sphinxで管 理とビルドしている. 32
poファイルをVSCodeで直接編集した後Sphinxで buildして日本語版HTMLを作成 VSCodeでGithub Copilotを利用できるよ うに設定しておくとGithub Copilotが翻 訳を支援してくれる。翻訳作業の効率 はこのやり方がいいかも。 33
ローカライゼーションの課題(1) ・GIS技術の体系基盤を担うようなソフトウェア文書 のローカライゼーションは技術体系普及のために あったほうがいい(GDAL,PDAL,PROJ等) 34
・オープンソースの場合ローカライズ作業メンバーの 確保や調整が必要. 個人的に作業開始を行うことも可能. コミュニティや学会が調整を行うといいのでは. 35 ローカライゼーションの課題(2)
・複数人で翻訳をやる場合翻訳作業の原則をつくり, 共有することが必要. ・日本語の文体,句読点,ロケール情報の統一. ・電子文書形式(reStructuredText, MarkDown等)の 規約,利用方法の統一 ・専門用語の共有( JSGI2.0 制定時の標準用語集) 36
ローカライゼーションの課題(3)
情報共有や議論ができる場所が必要 37 DiscordというBBSにGeo Community in Japanというグ ループを作成. #osgeoドキュ メント翻訳 と #qgisドキュメ
ント翻訳 という会議室を作 成. ここで日本語ローカライズ についての情報共有や意 見交換ができないか試行 中. 参加希望者は yoichi.kayama@gmail.com までご連絡下さい
ご清聴ありがとうございました 38