Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TensorFlow Docs Translation Proofreading
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Shuhei Fujiwara
May 28, 2020
Technology
940
0
Share
TensorFlow Docs Translation Proofreading
Shuhei Fujiwara
May 28, 2020
More Decks by Shuhei Fujiwara
See All by Shuhei Fujiwara
数理最適化を知ろう
shuheif
2
1.4k
Model Building in Mathematical Programming #2
shuheif
0
82
Nesterov #2
shuheif
0
92
Model Building in Mathematical Programming #1
shuheif
0
140
Nesterov
shuheif
2
200
tbf07-seat-optim.pdf
shuheif
1
10k
AdaNet
shuheif
1
420
Google Cloud Next Extended 2019 ML Day
shuheif
4
1.2k
TensorFlow Docs Translation JA
shuheif
1
990
Other Decks in Technology
See All in Technology
これからの「データマネジメント」の話をしよう
sansantech
PRO
0
170
PyCon JPに学ぶ『決め方の決め方』: TechLead Conference 2026
terapyon
1
240
目的ファーストのハーネス設計 ~ハーネスの変更容易性を高めるための優先順位~
gotalab555
9
3.3k
AIが自律的に働く時代へ Amazon Quick で実現するAIエージェント紹介
koheiyoshikawa
0
150
MySQL 9.7がやってきた ~これまでのあらすじと基本情報~ @ 日本MySQLユーザ会会2026年04月 / mysql97-yattekita
sakaik
0
110
Arcana: Production-Ready RAG in Elixir @ ElixirConf EU 2026
georgeguimaraes
0
120
AzureのIaC管理からログ調査まで、随所に役立つSkillsとCustom-Instructions / Boosting IaC and Log Analysis with Skills
aeonpeople
0
320
コードや知識を組み込む / Incorporate Code and Knowledge
ks91
PRO
0
180
Anthropic「Long-running a gents」をGeminiで再現してみた
tkikuchi
0
680
「責任あるAIエージェント」こそ自社で開発しよう!
minorun365
10
2.5k
GitHub Copilot CLI と VS Code Agent Mode の使い分け
tomokusaba
0
100
今年注目する!データ分析プラットフォームでのAIの活用
nayuts
0
170
Featured
See All Featured
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.6k
Marketing Yourself as an Engineer | Alaka | Gurzu
gurzu
0
180
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
2k
ラッコキーワード サービス紹介資料
rakko
1
3.1M
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
180
Context Engineering - Making Every Token Count
addyosmani
9
850
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
Principles of Awesome APIs and How to Build Them.
keavy
128
17k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
160
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.4k
Typedesign – Prime Four
hannesfritz
42
3k
Transcript
TensorFlow 日本語ドキュメント 自動校正ツールの変遷 @shuhei_fujiwara
自己紹介 藤原 秀平 (Shuhei Fujiwara) • TensorFlow User Group Tokyo
organizer • Google Developers Experts (ML) • TensorFlow 日本語ドキュメント reviewer ◦ 最近サボってますが…
今日の話 • 日本コミュニティの TensorFlow ドキュメント翻訳活動 • 最近のドキュメント翻訳の工夫 ◦ GitHub Actions
を使った自動校正
TensorFlow のドキュメントはオープンソース 有志のコントリビューターによって翻訳されている Repository はココ: https://github.com/tensorflow/docs-l10n
詳しい話はこちら https://speakerdeck.com/asei/tensorflow-falsedokiyumento fan-yi-woxing-ukomiyuniteihuo-dong-nituite
複数人で翻訳をしていると発生しがちな問題 用語の表記ゆれなど、文章のスタイルを揃えたい • パラメーター or パラメータ? • 「、」or「,」? • 半角
or 全角 • etc… レビューするのがしんどい...
RedPen https://redpen.cc/ • redpen-conf.xml に記載したルールに従って校正結果を出力してくれる ◦ 表記の統一、一文の長さの上限、etc… • 皆で共通の設定で redpen
の校正を通過すれば良さそう $ redpen --conf redpen-conf.xml HOGE.md
日本語翻訳の校正ツール誕生 だいたい @chie8842 さんが全部やってくれた https://github.com/tfug/proofreading • RedPen の設定ファイルをここで管理 • 対象のドキュメントに対して
RedPen を適用する シェルスクリプト • Jupyter Notebook ==> Markdown の変換
解決したこと • Reviewer の表記揺れを探す単純作業が減った • 「ツールがこう言っている」という指摘ができるので 角が立ちにくい(たぶん) ◦ 個人的に重要だと思っているポイント ◦
人に指摘されるより機械に指摘される方が精神的に楽だよね?
まだ解決していなかったこと 校正ツールを人間が実行しなければならない • Reviewer が皆の翻訳に対して都度実行して結果を 見せながら GitHub 上でレビューする ◦ かなり面倒くさい
• 翻訳者が PR を作る前に自分でチェックする ◦ 理想的だけど浸透させるのが難しい CI 上で実行されれば解決だよなぁ!?
CI 上で実行するまでの壁 • ドキュメントは tensorflow/docs 以下で管理されていた ◦ Google のリポジトリの構成は簡単にはいじらせてもらえない ◦
過去に一度ここに校正ツールを置こうとして失敗している • コミュニティによる翻訳が活性化して tensorflow/docs-l10 への引っ越しが 行われた ◦ 何かリポジトリオーナーが GitHub Actions 活用しようとした形跡を 発見した ◦ 今ならドサクサにまぎれていけるのでは…?
issue を立てて様子を見る https://github.com/tensorflow/docs-l10n/issues/144 • 日本語ドキュメントのディレクトリ内の diff にしか反応しないことを主張 ◦ GitHub Actions
の機能でできる(すごい便利!) • どんなファイルをどこに置こうとしてるか、何がどう便利か説明 • 好感触っぽかったので PR を作成
PR を作って説得しにいく https://github.com/tensorflow/docs-l10n/pull/185 Fork した自分のリポジトリ上で動いているスクリーンショットを見せて マージしてもらえるよう説明
PR 上での表示 • ディレクトリごとに校正を pass したか見える • 通らなかった場合翻訳者が 自分ですぐに気付ける!
GitHub Actions のログ • 校正ツールの実行結果が ログに出る • Reviewer が実行して結果を 共有する手間が省ける!
まとめ • 翻訳作業も自動化できるものは自動化できるといいよね • OSS では適当に交渉してみるのも大事かも