Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ドキュメントの翻訳に必要なこと
Search
Mayuko Sawai
May 15, 2022
Technology
0
780
ドキュメントの翻訳に必要なこと
LINE Technical Writing Meetup vol.13 (2022/5/12)での発表資料です。
Mayuko Sawai
May 15, 2022
Tweet
Share
More Decks by Mayuko Sawai
See All by Mayuko Sawai
テクニカルライターに必要な知識を学べる大学院の紹介/Introduction Master TCLoc
mayukosawai
2
910
Other Decks in Technology
See All in Technology
EDRの検知の仕組みと検知回避について
chayakonanaika
12
5.3k
OPENLOGI Company Profile for engineer
hr01
1
20k
Two Blades, One Journey: Engineering While Managing
ohbarye
4
2.6k
Log Analytics を使った実際の運用 - Sansan Data Hub での取り組み
sansantech
PRO
0
110
クラウド関連のインシデントケースを収集して見えてきたもの
lhazy
9
1.9k
30→150人のエンジニア組織拡大に伴うアジャイル文化を醸成する役割と取り組みの変化
nagata03
0
350
JAWS DAYS 2025 アーキテクチャ道場 事前説明会 / JAWS DAYS 2025 briefing document
naospon
0
2.8k
【Forkwell】「正しく」失敗できるチームを作る──現場のリーダーのための恐怖と不安を乗り越える技術 - FL#83 / A team that can fail correctly by forkwell
i35_267
1
100
大規模アジャイルフレームワークから学ぶエンジニアマネジメントの本質
staka121
PRO
3
1.6k
RaspberryPi CM4(CM5も)面白いぞ!
nonnoise
0
110
Amazon Athenaから利用時のGlueのIcebergテーブルのメンテナンスについて
nayuts
0
110
いまからでも遅くない!コンテナでWebアプリを動かしてみよう!コンテナハンズオン編
nomu
0
180
Featured
See All Featured
Put a Button on it: Removing Barriers to Going Fast.
kastner
60
3.7k
Designing Dashboards & Data Visualisations in Web Apps
destraynor
231
53k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
KATA
mclloyd
29
14k
The Invisible Side of Design
smashingmag
299
50k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
32
2.2k
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
28
9.3k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Scaling GitHub
holman
459
140k
Rebuilding a faster, lazier Slack
samanthasiow
80
8.9k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Music & Morning Musume
bryan
46
6.4k
Transcript
1 ドキュメントの翻訳に 必要なこと 澤井 真佑子 Technical Writer, CircleCI
2 本日の発表 • このような方向け ◦ ドキュメントの翻訳を他の会社はどうやっているのか聞 いてみたい ◦ どんな準備やツールが必要か知りたい
3 • ドキュメントサイトの翻訳をどの ように行っているか? • 翻訳に使われるCATツール、翻 訳メモリや用語集の扱い方 など お話しする内容
4 自己紹介 • 名前:澤井 真佑子 / Mayuko Sawai Technical Writer
@ CircleCI (2021.12 〜) • 経歴 ◦ 前職はサイボウズのテクニカルライター • ストラスブール大学のオンライン修士課程で Technical communication & Localization を 勉強中 (LINE TWM vol.7 で紹介) 「テクニカルライターが働きながら学ぶ大学院を紹介します」 https://blog.cybozu.io/entry/2021/09/10/084825
5 CircleCIの紹介
6 CircleCIの概要
7 Continuous Integration(継続的インテグレーション) • コードの変更を迅速かつ安全に マージできる ◦ ビルド ◦ コード解析
◦ 自動化されたテスト ◦ 脆弱性チェック • 効果 ◦ 手戻りの防止 ◦ リリース品質の向上 ◦ 長期的なコスト削減
8 Continuous Deployment(継続的デプロイメント) • コードの変更を迅速かつ 安全に展開・配信する • 効果 ◦ 人手によるミスの防止
◦ 素早いユーザーへの 価値提供
9 Free プランでも十分なビルド時間で自動化可能 Free プランでも 十分なビルド時間で自動化可能 ・毎月6,000分相当のクレジッ トを付与、最適なリソース クラス (CPU/RAM)
を選択可能 ・ユーザー数は無制限 だから チーム開発にも適用可能 ・パワフルなリソースクラス 、 Docker コンテナやVM(Linux, Windows, Mac)を利用可能 同じ時間枠でも CircleCI なら 利用可能な機能がこんなにも ・スピードとパフォーマンスが 向上、Docker コンテナを最適化 ・ビルドがより高速化 、 同時に30並列実行まで可能 ・プライベート Orb で CI/CD も コラボレーション 、設定の 部品化、組織内での再利用可能 ・ビルド時間は約2倍 、自動化 の結果をより早く得られます フィードバックループを回し ソフトウェアを素早く届ける ・ビルド時間を短縮可能 なのは ジョブを並列実行できるから ・インテリジェントにテスト 分割した上で並列実行可能 (ファイル数、ファイルサイズ、 ログからの実行時間実績で分割 ) ・インサイト機能で失敗しがち なテストや結果が不安定なテス トなどを抽出可能 ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja
10 CircleCIのドキュメント
11 CircleCI ドキュメントの特徴 • オープンソース ◦ テクニカルライターだけでなく、エンジニアも書く ◦ 社内外からプルリクエストが来る •
更新頻度が高い(毎日どこかのページが変更されている) • 翻訳版は現在のところ日本語のみ
12 私の担当範囲 • CircleCI ドキュメント ◦ 日本語翻訳のマネジメント (社内外の翻訳者とやり取り) ◦ 用語集の作成、更新
◦ スタイルガイド作成、更新 ◦ 品質チェック • changelog (リリースノート)、discuss (掲示 板)、ブログ、プロモーションページなどの翻訳 管理も担当
13 ここからは、ドキュメント翻訳をどのように行っているか、 まず基盤の面から紹介していきます。
14 CircleCI ドキュメントの基盤(GitHub)と 翻訳システム(CAT tool) GitHub 記事ファイル テクニカル ライター 社内コントリ
ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
15 こちら側は知ってる人が多いと思います GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ
16 今日はCATツールの仕組みや使い方を紹介します GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
17 CATツールとは 翻訳メモリ、用語集などの構成要素について
18 CAT (Computer-aided-translation) は、人間の翻訳をコンピューターが支援 するツール • さまざまなファイル形式を同一のシステム上で扱うことができる • 翻訳メモリ (TM)、用語集、機械翻訳、QAなどの機能
• プロジェクト管理、APIなどの拡張機能を含めて TMS (Translation management system) と呼ばれることもある CATツールとは
19 代表的なTMS https://www.nimdzi.com/the-tms-arena-nimdzi-finger-food/ TMS: Translation Management System. CATツールにプロジェクト管理などの機能が加わったもの
20 文章やパラグラフ単位で過去の翻訳を蓄積したデータベース。 ソース言語とターゲット言語が対になっている。 使われ方 • CATツールで翻訳するとき、翻訳メモリが検索され、同一または 似ている原文に対して翻訳がサジェストされる → 👍 同じ文、似た文を翻訳する手間を省ける
→ 👍 スタイルを統一できる • CATツール上で翻訳すると、自動的に翻訳メモリにデータが 追加・更新される 翻訳メモリとは
21 翻訳料金の計算例 マッチ率 単価 ワード数 金額 100%マッチ ¥5.0 30 ¥150
85-94%マッチ ¥15.0 37 ¥555 75-84%マッチ ¥20.0 96 ¥1,920 50-74%マッチ ¥20.0 700 ¥14,000 ノーマッチ ¥20.0 1250 ¥25,000 • 翻訳メモリがあると、翻訳 コストを下げられる場合が 多い
22 用語集と翻訳メモリはどう違う? • 翻訳メモリだけあれば十分なのでは? • 用語集はどう役に立つの?
23 翻訳エディター画面 (Memsourceの例) https://youtu.be/WHxxxCvNqxo • 「96%マッチ」など、翻訳メモ リとのマッチ率つきで訳文が サジェストされる • 用語集に登録されている語
も、訳語が示される • 機械翻訳の結果を入れるこ ともできる
24 翻訳メモリと用語集 翻訳メモリ • セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50% などの数字を出す • コスト算出に使われる •
翻訳することで自動的にデータが更新される 用語集 • 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベ ルの一致を見る • コスト算出には使われない • 翻訳メモリのように、翻訳すれば自動的に更新されるもので はない • 誰かが新しい用語を提案し、データベースを管理する必要が ある
25 用語集と翻訳メモリ つまり、 • 翻訳メモリは、歴史的な積み上げ • 用語集は、人手で最新に保たれた、その言語を制御する モジュール 翻訳メモリと用語集は、期待される役割が異なり、 組み合わせて使われる。
26 よくある使われ方 • 用語集と翻訳メモリを組み合わせて使い、不一致があれば、用語集を優先 させる ◦ 長年使われている翻訳メモリには「今はもうその言い方はしない」という 翻訳が残っている。用語集は人手で最新に保たれているので、翻訳メ モリとのコンフリクトが起こる。 この場合、用語集に従うべきとする運用が多い。
(そういう使い方をしないなら、翻訳メモリだけでいいという話になる)
27 翻訳メモリの運用Tips • なるべく細かい単位で作っておく ◦ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など → 👍 これにより、継続的に適切に翻訳メモリが更新される •
read (参照)と write (更新)の設定をうまく使う ◦ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、 更新はマーケティングの翻訳メモリのみにする等 • (超基本)使わない翻訳のデータは削除する → 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある
28 用語集の運用Tips • 内容を最新に保つ ◦ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと 全く役に立たなくなる ◦ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッド
シートを共有し、週1回、用語集への追加作業を実施 • 最初は小さく始める ◦ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しず つ足していく方が良い • なるべく多くメタデータを付与する ◦ 翻訳者の判断の助けになる
29 用語管理が不十分だとどうなる? • 用語管理は、最初は大 変だが、後になるほど楽 になる ✌ • やらないと、後になるほ ど大変
😱 From: https://www.slideshare.net/akashjd/prof-klaus-terminology-management
30 まとめ • CircleCI ドキュメントの翻訳をどのように行っているか • CATツールとは? • 翻訳メモリ、用語集にはそれぞれどんな役割があるか •
翻訳メモリ、用語集の運用Tips
31 Thank you.