Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TensorFlow のドキュメント翻訳を行うコミュニティ活動について
Search
Asei Sugiyama
December 14, 2019
Technology
2.3k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
TensorFlow のドキュメント翻訳を行うコミュニティ活動について
GDG DevFest 2019 での登壇資料です
https://tokyo.gdgjapan.org/devfest2019
Asei Sugiyama
December 14, 2019
More Decks by Asei Sugiyama
See All by Asei Sugiyama
生成 AI 実践ガイド (概略版) AIガバナンス編
asei
0
230
コードを1行も書けなかった僕がエンジニアになるまでの振り返り
asei
0
60
MLOps に至るまで
asei
1
27
Cynefin Framework を用いた AI Native 組織へのパラダイムシフト
asei
0
83
Algorithm behind Gemini Enterprise Agent Designer
asei
0
270
Algothythm behind Gemini Enterprise Agent Designer (with least amount of inputs from human)
asei
0
95
AI との良い付き合い方を僕らは誰も知らない (WSS 2026 静岡版)
asei
1
630
AI との良い付き合い方を僕らは誰も知らない
asei
1
610
最近の生成 AI の活用事例紹介
asei
3
500
Other Decks in Technology
See All in Technology
製造現場での生成AIの活用、およびエージェントAIの実装のあり方、AVEVAの取り組み
iotcomjpadmin
0
180
From Prompt Engineering to Loop Engineering
shibuiwilliam
1
280
從觀望到全公司落地:AI Agentic Coding 導入實戰 — 流程整合與安全治理
appleboy
0
160
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
11k
從開發到部署全都交給 AI:實作 AI 驅動的自動化流程
appleboy
0
180
クレデンシャル流出 ― 攻撃 3 時間 vs 復旧 10 時間。この非対称性にどう備えるか
kazzpapa3
3
620
AI-DLCを “そのまま導入しなかった”話 ~組織に合わせてアジャストした 私たちの実践共有~
hiroramos4
PRO
1
440
AWS Summit の片隅で、体育座りしながらコミュニティがにぎわう理由を考えた
k_adachi_01
2
230
どうして今サーバーサイドKotlinを選択したのか
nealle
0
100
Docker Desktop不要の時代が来る? WSL標準の「wslc」で Linuxコンテナを動かしてみた.
ueponx
0
140
AIに障害切り分けを全部やってもらった。 。 。 。
estie
0
260
BPaaSで進むAIオペレーションの現在地 AI実装が効く領域とスケーラビリティの選定と実装
kentarofujii
0
210
Featured
See All Featured
Intergalactic Javascript Robots from Outer Space
tanoku
273
27k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.5k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
194
17k
A Tale of Four Properties
chriscoyier
163
24k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
AI in Enterprises - Java and Open Source to the Rescue
ivargrimstad
0
1.3k
Context Engineering - Making Every Token Count
addyosmani
9
990
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
123
22k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
420
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
2
220
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
330
Transcript
TensorFlow のドキュメント翻訳を行う コミュニティ活動について
杉山 阿聖 Software Engineer @ Repro AI Labs 機械学習, 統計,
R&D, 開発 TensorFlow Docs 翻訳 & レビュー 翻訳:Performance with tf.function レビュー: Tutorials などなど 機械学習図鑑 共著
https://japan.googleblog.com/2019/12/books-for-students.html 3
1. イメージが伝わるようにする Web エンジニアが雰囲気をわかる 厳密さよりもわかりやすさ 2. 数式を用いた詳細な記述は行わない 日本語と図で頑張る 機械学習図鑑 4
ご推薦いただき本当にありがとうございました
TensorFlow のドキュメント翻訳を行う コミュニティ活動について
ドキュメント翻訳は楽しい 1. TensorFlow について詳しくなれる 2. コミュニティで知識を交換しあえる 3. 世界を変えることができる 今日お伝えしたいこと 7
Contents 1. TensorFlow docs の翻訳について <- 2. 翻訳の楽しさについて 3. 翻訳活動の難しさについて
1. TensorFlow docs とは 2. TensorFlow docs の翻訳活動について 3. 日本コミュニティでのこれまでの活動について
TensorFlow docs の翻訳について 9
TensorFlow docs 10
tensorflow.org で提供されるドキュメントのうち、Guide, Tutorials などの総称 tensorflow/docs というリポジトリで管理される 内容は TensorFlow Core, tfjs,
tf.lite, tfx, Swift for TensorFlow と幅広い 独自のリポジトリ内で別にドキュメントを作成している場合も 例: tensorboard/docs TensorFlow API reference は別枠扱い (docsrting で書かれる) TensorFlow docs とは 11
Markdown と Jupyter Notebook で構成されている Notebook は Colab で起動できる dark
mode がある 特徴 12
TensorFlow 2 quickstart for experts Demo 13
ドキュメントは英語で書かれたものを source-of-truth として取り扱う 各国語への翻訳は、各国のコミュニティ主導で行われている TensorFlow docs の翻訳活動 14
11 ヶ国語への翻訳が進行中 15
TensorFlow 2 quickstart for beginners Demo 16
時期 内容 2019/03 @masa-ita による ja/tutorials/keras の翻訳 PR 2019/04 レビューが行われ
PR が取り込まれる オフライン活動 (TensorFlow のドキュメントを翻訳しつつ勉強する会#1) 2019/05 Keras, hub, tfjs, xla, autograph の翻訳に関する PR が merge 2019/06 tutorial や tf.lite, tfp も翻訳が進み PR が merge される 2019/08 レビュワーが増えだす (2019/12 現在 8 名) 2019/11 オフライン活動 (TensorFlow のドキュメントを翻訳しつつ勉強する会#2) 日本コミュニティでのこれまでの活動 17
すべての始まり 18
続々と集まるレビュワー (1/2) 19
続々と集まるレビュワー (2/2) 20
リリース 21
翻訳活動をすすめるためのコミュ ニティが立ち上がる オフライン & オンラインで活動を 開始 オフラインで翻訳するイベントを 2 回開催 オンラインでは随時
GitHub & Slack で活動継続中 コミュニティ活動 22
TensorFlow を翻訳しつつ勉強する会 #2 23
Google Developers ML Summit Tokyo vol 3 で紹介される Jeff Dean
が来日した会 写真に写っている方は Mike Liang (Product Manager, TensorFlow) ML Summit Tokyo 24
現在も活発に活動中 25
Contents 1. TensorFlow docs の翻訳について 2. 翻訳の楽しさについて <- 3. 翻訳活動の難しさについて
1. TensorFlow について詳しくなれる <- 2. コミュニティで知識を交換しあえる 3. 世界を変えることができる 翻訳の楽しさについて 27
内容が豊富 深く理解できる 得た知識の活用例 tf.function による高速化 1. TensorFlow について詳しくなれる 28
Tutorial だけでも さまざまな内容の ドキュメントが用 意されている Keras Numpy, pandas CNN, RNN
Word embedding Transfer learning GAN 内容が豊富 29
TensorBoard TFX TensorFlow Hub Datasets Model Optimization Probability TensorFlow Federated
XLA Neural Structured Learning TensorFlow Agents TensorFlow Ranking Extensions (一部) 30
翻訳することは、理解したことを自分の言葉で他人に伝えることと同じ 英語のドキュメントを読み、動かして理解する 関連するドキュメントを読み、動かして理解する 結果を自分の言葉で記述する 翻訳は自分の理解度に対する良いテストになる 翻訳することで理解を確認できる 31
様々な分野の理解が必要になった例 : TFX 32
better performance with tf.function.ipynb 得た知識の活用例 tf.function による高速化 33
翻訳を行い、理解度をテストしながら読むことで、理解を深められる 分野が幅広いため、自分の引き出しを広げられる 1. TensorFlow について詳しくなれる 34
1. TensorFlow について詳しくなれる 2. コミュニティで知識を交換しあえる <- 3. 世界を変えることができる 翻訳の楽しさについて 35
理解を深められる 互いに褒め合うのは大事 2. コミュニティで知識を交換しあえる 36
TensorFlow Core のドキュメントの翻訳には大まかに言って次が必要 機械学習の知識 プログラミングの知識 : Python, OOP, Functional Programming
TensorFlow の知識 TensorFlow Core 以外を翻訳しようとすると、追加の知識が必要 TensorFlow.js : JavaScript tf.lite, XLA : 低レイヤー TFX : Apache Beam, Apache Airflow, Kubeflow (k8s), etc. Swift for TensorFlow : Swift tfp : 確率的プログラミング ... and so on. 翻訳には莫大な知識が必要になる 37
自分の理解を確認し、 理解の幅を広げる機会 はなかなかない レビューを通して、コ ミュニティで自分の理 解を深められる 自分の知識が深くない 分野について、改めて 見直す機会になる 理解を深められる
38
文中の Python primitives はどう訳せるでしょうか? tf.function works best with TensorFlow ops,
rather than NumPy ops or Python primitives.
40
41
42
より良い訳が思いついたあなた! 今がまさにコントリビュートの機会です!
互いに褒め合うのは大事 44
互いに褒め合うのは大事 45
互いに褒め合うのは大事 46
指摘も大事、互いに褒め合うのも大事 コミュニティ活動を通じて適切なフィードバックが得られる 2. コミュニティで知識を交換しあえる 47
1. TensorFlow について詳しくなれる 2. コミュニティで知識を交換しあえる 3. 世界を変えることができる <- 翻訳の楽しさについて 48
1. 日本語のドキュメントに助けられてきたから 2. 翻訳することで世界を変えることができる なぜ翻訳したいのか? 49
Q: man ってどう読むんですか A: man man Q: man ってどうやったら読めるようになるんですか A:
読もうとするうちに読めるようになる Q: man コマンドってどうやったら終えられるんですか A: man less を読め Q: 打てないんですが A: h を打て man を読め 50
51
52
大量の日本語ドキュメントが見つかる安心感 (黒い画面じゃない) 少なくとも同じことで悩んでいた人がいた!仲間がいた! なぜ検索するのか 53
今読めるのは先人の努力の結果 最初からできたわけではない 返すべき恩がある 巨人になれなくとも、巨人の肩ま での階段なら作れるかもしれない 日本語のドキュメントに 助けられてきた 54
誰がこんな難しいことをやるのか 単純に英語の文章を読めばよいのではないか いつの日にか公式的にやってくれるのではないか でも、少なくとも TensorFlow のドキュメントについてはそうではない 自分で理解して、他人にわかるように説明したドキュメントがある世界は、それが ない世界よりもずっと良い 先人たちもそのような思いだったのでは 他人にわかるように説明すること
= 翻訳で恩返しをして、より良い世界にできる やってみたら意外と楽しいし! TensorFlow のドキュメント翻訳についての雑感 55
1. 今、ドキュメントを読めるのは先人の努力のおかげ 2. 翻訳を行うことで自分で理解して他人にわかるように説明したドキュメントのある 世界を実現できる 3. 世界を変えることができる 56
Contents 1. TensorFlow docs の翻訳について 2. 翻訳の楽しさについて 3. 翻訳活動の難しさについて <-
0. 翻訳活動の根本的な難しさ 1. 手順が不明確 2. 未着手が多い 3. 変更への追従ができていない 翻訳活動の難しさについて 58
コミュニティを作り定着させることが大事 日本コミュニティについては一山越えた感 翻訳活動の根本的な難しさ 59
少人数で活動してきて いたため、手順が不明 確な箇所がまだある 右は翻訳すべきでない ドキュメントを翻訳し た筆者に対する丁寧な 対応の図 Jupyter Notebook のレ
ビューも現状では json を気合でレビュー勢が 多い 1. 手順が不明確 60
表記ゆれチェック ツール Markdown と Notebook に対応 Thanks: sfujiwara chie8842 Proofreading
(RedPen) 61
着手できたのはファイル数で ja / en = 65 / 228 (29%) くらい
tensorflow/docs に限定して diff を撮ってみたのが右図 関連ドキュメントを含めると比率 はまだ下がりそう まだまだやることはたくさんある 個人的には TFX と Swift for TensorFlow をやっていきたい 2. 未着手が多い 62
ドキュメントの変更が 結構激しく、追従がで きていない 急速に拡大する TensorFlow エコシステ ムへの追従も考慮でき ると良さそう 3. 変更への追従
63
翻訳以外にも英語ドキ ュメントの修正を行う ケースも ドキュメントとコード の不整合やリンク切れ を修正 ドキュメントそのもの を追加するケースも 英語ドキュメント の修正
64
0. コミュニティを立ち上げ翻訳活動を継続できた 1. 活動を継続する中で手順が不明瞭になっているので明文化していきたい 2. まだまだ翻訳に着手できていない分野も多いのでフロンティアが広がっている 3. 変更に追従するのは短時間でできるので最初はこれからやると良いかも 4. 英語ドキュメントの修正や追加もやっていきたい
翻訳活動の難しさについて 65
We are looking forward to seeing your contribution!