LINE Technical Writing Meetup vol.13 (2022/5/12)での発表資料です。
1ドキュメントの翻訳に必要なこと澤井 真佑子Technical Writer, CircleCI
View Slide
2本日の発表● このような方向け○ ドキュメントの翻訳を他の会社はどうやっているのか聞いてみたい○ どんな準備やツールが必要か知りたい
3● ドキュメントサイトの翻訳をどのように行っているか?● 翻訳に使われるCATツール、翻訳メモリや用語集の扱い方などお話しする内容
4自己紹介● 名前:澤井 真佑子 / Mayuko SawaiTechnical Writer @ CircleCI (2021.12 〜)● 経歴○ 前職はサイボウズのテクニカルライター● ストラスブール大学のオンライン修士課程でTechnical communication & Localization を勉強中 (LINE TWM vol.7 で紹介)「テクニカルライターが働きながら学ぶ大学院を紹介します」 https://blog.cybozu.io/entry/2021/09/10/084825
5CircleCIの紹介
6CircleCIの概要
7Continuous Integration(継続的インテグレーション)● コードの変更を迅速かつ安全にマージできる○ ビルド○ コード解析○ 自動化されたテスト○ 脆弱性チェック● 効果○ 手戻りの防止○ リリース品質の向上○ 長期的なコスト削減
8Continuous Deployment(継続的デプロイメント)● コードの変更を迅速かつ安全に展開・配信する● 効果○ 人手によるミスの防止○ 素早いユーザーへの価値提供
9Free プランでも十分なビルド時間で自動化可能Free プランでも十分なビルド時間で自動化可能・毎月6,000分相当のクレジッ トを付与、最適なリソース クラス (CPU/RAM) を選択可能・ユーザー数は無制限 だから チーム開発にも適用可能・パワフルなリソースクラス 、 Docker コンテナやVM(Linux, Windows, Mac)を利用可能同じ時間枠でも CircleCI なら利用可能な機能がこんなにも・スピードとパフォーマンスが 向上、Docker コンテナを最適化・ビルドがより高速化 、 同時に30並列実行まで可能・プライベート Orb で CI/CD も コラボレーション 、設定の 部品化、組織内での再利用可能・ビルド時間は約2倍 、自動化 の結果をより早く得られますフィードバックループを回しソフトウェアを素早く届ける・ビルド時間を短縮可能 なのは ジョブを並列実行できるから・インテリジェントにテスト 分割した上で並列実行可能 (ファイル数、ファイルサイズ、 ログからの実行時間実績で分割)・インサイト機能で失敗しがち なテストや結果が不安定なテス トなどを抽出可能ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja
10CircleCIのドキュメント
11CircleCI ドキュメントの特徴● オープンソース○ テクニカルライターだけでなく、エンジニアも書く○ 社内外からプルリクエストが来る● 更新頻度が高い(毎日どこかのページが変更されている)● 翻訳版は現在のところ日本語のみ
12私の担当範囲● CircleCI ドキュメント○ 日本語翻訳のマネジメント(社内外の翻訳者とやり取り)○ 用語集の作成、更新○ スタイルガイド作成、更新○ 品質チェック● changelog (リリースノート)、discuss (掲示板)、ブログ、プロモーションページなどの翻訳管理も担当
13ここからは、ドキュメント翻訳をどのように行っているか、まず基盤の面から紹介していきます。
14CircleCI ドキュメントの基盤(GitHub)と翻訳システム(CAT tool)GitHub記事ファイルテクニカルライター社内コントリビューター社外コントリビューターCAT Tool翻訳メモリー翻訳者翻訳者EnJa① 記事をプッシュ② 定期的にSync③ 原文の変更箇所 だけを翻訳④ 翻訳結果をプッシュCAT: Computer-aided translation
15こちら側は知ってる人が多いと思いますGitHub記事ファイルテクニカルライター社内コントリビューター社外コントリビューターCAT Tool翻訳メモリー翻訳者翻訳者EnJa① 記事をプッシュ② 定期的にSync③ 原文の変更箇所 だけを翻訳④ 翻訳結果をプッシュ
16今日はCATツールの仕組みや使い方を紹介しますGitHub記事ファイルテクニカルライター社内コントリビューター社外コントリビューターCAT Tool翻訳メモリー翻訳者翻訳者EnJa① 記事をプッシュ② 定期的にSync③ 原文の変更箇所 だけを翻訳④ 翻訳結果をプッシュCAT: Computer-aided translation
17CATツールとは翻訳メモリ、用語集などの構成要素について
18CAT (Computer-aided-translation) は、人間の翻訳をコンピューターが支援するツール● さまざまなファイル形式を同一のシステム上で扱うことができる● 翻訳メモリ (TM)、用語集、機械翻訳、QAなどの機能● プロジェクト管理、APIなどの拡張機能を含めて TMS (Translationmanagement system) と呼ばれることもあるCATツールとは
19代表的なTMShttps://www.nimdzi.com/the-tms-arena-nimdzi-finger-food/TMS: Translation Management System. CATツールにプロジェクト管理などの機能が加わったもの
20文章やパラグラフ単位で過去の翻訳を蓄積したデータベース。ソース言語とターゲット言語が対になっている。使われ方● CATツールで翻訳するとき、翻訳メモリが検索され、同一または似ている原文に対して翻訳がサジェストされる→ 👍 同じ文、似た文を翻訳する手間を省ける→ 👍 スタイルを統一できる● CATツール上で翻訳すると、自動的に翻訳メモリにデータが追加・更新される翻訳メモリとは
21翻訳料金の計算例マッチ率 単価 ワード数 金額100%マッチ ¥5.0 30 ¥15085-94%マッチ ¥15.0 37 ¥55575-84%マッチ ¥20.0 96 ¥1,92050-74%マッチ ¥20.0 700 ¥14,000ノーマッチ ¥20.0 1250 ¥25,000● 翻訳メモリがあると、翻訳コストを下げられる場合が多い
22用語集と翻訳メモリはどう違う?● 翻訳メモリだけあれば十分なのでは?● 用語集はどう役に立つの?
23翻訳エディター画面 (Memsourceの例)https://youtu.be/WHxxxCvNqxo● 「96%マッチ」など、翻訳メモリとのマッチ率つきで訳文がサジェストされる● 用語集に登録されている語も、訳語が示される● 機械翻訳の結果を入れることもできる
24翻訳メモリと用語集翻訳メモリ ● セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50%などの数字を出す● コスト算出に使われる● 翻訳することで自動的にデータが更新される用語集 ● 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベルの一致を見る● コスト算出には使われない● 翻訳メモリのように、翻訳すれば自動的に更新されるものではない● 誰かが新しい用語を提案し、データベースを管理する必要がある
25用語集と翻訳メモリつまり、● 翻訳メモリは、歴史的な積み上げ● 用語集は、人手で最新に保たれた、その言語を制御するモジュール翻訳メモリと用語集は、期待される役割が異なり、組み合わせて使われる。
26よくある使われ方● 用語集と翻訳メモリを組み合わせて使い、不一致があれば、用語集を優先させる○ 長年使われている翻訳メモリには「今はもうその言い方はしない」という翻訳が残っている。用語集は人手で最新に保たれているので、翻訳メモリとのコンフリクトが起こる。この場合、用語集に従うべきとする運用が多い。(そういう使い方をしないなら、翻訳メモリだけでいいという話になる)
27翻訳メモリの運用Tips● なるべく細かい単位で作っておく○ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など→ 👍 これにより、継続的に適切に翻訳メモリが更新される● read (参照)と write (更新)の設定をうまく使う○ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、更新はマーケティングの翻訳メモリのみにする等● (超基本)使わない翻訳のデータは削除する→ 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある
28 用語集の運用Tips● 内容を最新に保つ○ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと全く役に立たなくなる○ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッドシートを共有し、週1回、用語集への追加作業を実施● 最初は小さく始める○ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しずつ足していく方が良い● なるべく多くメタデータを付与する○ 翻訳者の判断の助けになる
29用語管理が不十分だとどうなる?● 用語管理は、最初は大変だが、後になるほど楽になる ✌● やらないと、後になるほど大変 😱From: https://www.slideshare.net/akashjd/prof-klaus-terminology-management
30 まとめ● CircleCI ドキュメントの翻訳をどのように行っているか● CATツールとは?● 翻訳メモリ、用語集にはそれぞれどんな役割があるか● 翻訳メモリ、用語集の運用Tips
31Thank you.