Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TensorFlow Docs Translation Proofreading
Search
Shuhei Fujiwara
May 28, 2020
Technology
0
910
TensorFlow Docs Translation Proofreading
Shuhei Fujiwara
May 28, 2020
Tweet
Share
More Decks by Shuhei Fujiwara
See All by Shuhei Fujiwara
数理最適化を知ろう
shuheif
2
1.4k
Model Building in Mathematical Programming #2
shuheif
0
78
Nesterov #2
shuheif
0
80
Model Building in Mathematical Programming #1
shuheif
0
130
Nesterov
shuheif
2
180
tbf07-seat-optim.pdf
shuheif
1
9.9k
AdaNet
shuheif
1
410
Google Cloud Next Extended 2019 ML Day
shuheif
4
1.2k
TensorFlow Docs Translation JA
shuheif
1
980
Other Decks in Technology
See All in Technology
【Agentforce Hackathon Tokyo 2025 発表資料】みらいシフト:あなた働き方を、みらいへシフト。
kuratani
0
120
スクラムマスターが スクラムチームに入って取り組む5つのこと - スクラムガイドには書いてないけど入った当初から取り組んでおきたい大切なこと -
scrummasudar
3
2.1k
Bill One 開発エンジニア 紹介資料
sansan33
PRO
4
17k
サラリーマンソフトウェアエンジニアのキャリア
yuheinakasaka
40
19k
Digitization部 紹介資料
sansan33
PRO
1
6.5k
20260114_データ横丁 新年LT大会:2026年の抱負
taromatsui_cccmkhd
0
250
Claude Codeを使った情報整理術
knishioka
20
12k
モノタロウ x クリエーションラインで実現する チームトポロジーにおける プラットフォームチーム・ ストリームアラインドチームの 効果的なコラボレーション
creationline
0
860
Kusakabe_面白いダッシュボードの表現方法
ykka
0
250
RALGO : AIを組織に組み込む方法 -アルゴリズム中心組織設計- #RSGT2026 / RALGO: How to Integrate AI into an Organization – Algorithm-Centric Organizational Design
kyonmm
PRO
3
1.3k
「駆動」って言葉、なんかカッコイイ_Mitz
comucal
PRO
0
140
Master Dataグループ紹介資料
sansan33
PRO
1
4.2k
Featured
See All Featured
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
0
280
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
38
2.7k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1k
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
Google's AI Overviews - The New Search
badams
0
890
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.3k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
240
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.8k
Everyday Curiosity
cassininazir
0
120
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
65
35k
Transcript
TensorFlow 日本語ドキュメント 自動校正ツールの変遷 @shuhei_fujiwara
自己紹介 藤原 秀平 (Shuhei Fujiwara) • TensorFlow User Group Tokyo
organizer • Google Developers Experts (ML) • TensorFlow 日本語ドキュメント reviewer ◦ 最近サボってますが…
今日の話 • 日本コミュニティの TensorFlow ドキュメント翻訳活動 • 最近のドキュメント翻訳の工夫 ◦ GitHub Actions
を使った自動校正
TensorFlow のドキュメントはオープンソース 有志のコントリビューターによって翻訳されている Repository はココ: https://github.com/tensorflow/docs-l10n
詳しい話はこちら https://speakerdeck.com/asei/tensorflow-falsedokiyumento fan-yi-woxing-ukomiyuniteihuo-dong-nituite
複数人で翻訳をしていると発生しがちな問題 用語の表記ゆれなど、文章のスタイルを揃えたい • パラメーター or パラメータ? • 「、」or「,」? • 半角
or 全角 • etc… レビューするのがしんどい...
RedPen https://redpen.cc/ • redpen-conf.xml に記載したルールに従って校正結果を出力してくれる ◦ 表記の統一、一文の長さの上限、etc… • 皆で共通の設定で redpen
の校正を通過すれば良さそう $ redpen --conf redpen-conf.xml HOGE.md
日本語翻訳の校正ツール誕生 だいたい @chie8842 さんが全部やってくれた https://github.com/tfug/proofreading • RedPen の設定ファイルをここで管理 • 対象のドキュメントに対して
RedPen を適用する シェルスクリプト • Jupyter Notebook ==> Markdown の変換
解決したこと • Reviewer の表記揺れを探す単純作業が減った • 「ツールがこう言っている」という指摘ができるので 角が立ちにくい(たぶん) ◦ 個人的に重要だと思っているポイント ◦
人に指摘されるより機械に指摘される方が精神的に楽だよね?
まだ解決していなかったこと 校正ツールを人間が実行しなければならない • Reviewer が皆の翻訳に対して都度実行して結果を 見せながら GitHub 上でレビューする ◦ かなり面倒くさい
• 翻訳者が PR を作る前に自分でチェックする ◦ 理想的だけど浸透させるのが難しい CI 上で実行されれば解決だよなぁ!?
CI 上で実行するまでの壁 • ドキュメントは tensorflow/docs 以下で管理されていた ◦ Google のリポジトリの構成は簡単にはいじらせてもらえない ◦
過去に一度ここに校正ツールを置こうとして失敗している • コミュニティによる翻訳が活性化して tensorflow/docs-l10 への引っ越しが 行われた ◦ 何かリポジトリオーナーが GitHub Actions 活用しようとした形跡を 発見した ◦ 今ならドサクサにまぎれていけるのでは…?
issue を立てて様子を見る https://github.com/tensorflow/docs-l10n/issues/144 • 日本語ドキュメントのディレクトリ内の diff にしか反応しないことを主張 ◦ GitHub Actions
の機能でできる(すごい便利!) • どんなファイルをどこに置こうとしてるか、何がどう便利か説明 • 好感触っぽかったので PR を作成
PR を作って説得しにいく https://github.com/tensorflow/docs-l10n/pull/185 Fork した自分のリポジトリ上で動いているスクリーンショットを見せて マージしてもらえるよう説明
PR 上での表示 • ディレクトリごとに校正を pass したか見える • 通らなかった場合翻訳者が 自分ですぐに気付ける!
GitHub Actions のログ • 校正ツールの実行結果が ログに出る • Reviewer が実行して結果を 共有する手間が省ける!
まとめ • 翻訳作業も自動化できるものは自動化できるといいよね • OSS では適当に交渉してみるのも大事かも