Slide 1

Slide 1 text

1 ドキュメントの翻訳に 必要なこと 澤井 真佑子 Technical Writer, CircleCI

Slide 2

Slide 2 text

2 本日の発表 ● このような方向け ○ ドキュメントの翻訳を他の会社はどうやっているのか聞 いてみたい ○ どんな準備やツールが必要か知りたい

Slide 3

Slide 3 text

3 ● ドキュメントサイトの翻訳をどの ように行っているか? ● 翻訳に使われるCATツール、翻 訳メモリや用語集の扱い方 など お話しする内容

Slide 4

Slide 4 text

4 自己紹介 ● 名前:澤井 真佑子 / Mayuko Sawai Technical Writer @ CircleCI (2021.12 〜) ● 経歴 ○ 前職はサイボウズのテクニカルライター ● ストラスブール大学のオンライン修士課程で Technical communication & Localization を 勉強中 (LINE TWM vol.7 で紹介) 「テクニカルライターが働きながら学ぶ大学院を紹介します」    https://blog.cybozu.io/entry/2021/09/10/084825

Slide 5

Slide 5 text

5 CircleCIの紹介

Slide 6

Slide 6 text

6 CircleCIの概要

Slide 7

Slide 7 text

7 Continuous Integration(継続的インテグレーション) ● コードの変更を迅速かつ安全に マージできる ○ ビルド ○ コード解析 ○ 自動化されたテスト ○ 脆弱性チェック ● 効果 ○ 手戻りの防止 ○ リリース品質の向上 ○ 長期的なコスト削減

Slide 8

Slide 8 text

8 Continuous Deployment(継続的デプロイメント) ● コードの変更を迅速かつ 安全に展開・配信する ● 効果 ○ 人手によるミスの防止 ○ 素早いユーザーへの 価値提供

Slide 9

Slide 9 text

9 Free プランでも十分なビルド時間で自動化可能 Free プランでも 十分なビルド時間で自動化可能 ・毎月6,000分相当のクレジッ  トを付与、最適なリソース  クラス (CPU/RAM) を選択可能 ・ユーザー数は無制限 だから  チーム開発にも適用可能 ・パワフルなリソースクラス 、  Docker コンテナやVM(Linux,  Windows, Mac)を利用可能 同じ時間枠でも CircleCI なら 利用可能な機能がこんなにも ・スピードとパフォーマンスが  向上、Docker コンテナを最適化 ・ビルドがより高速化 、  同時に30並列実行まで可能 ・プライベート Orb で CI/CD も  コラボレーション 、設定の  部品化、組織内での再利用可能 ・ビルド時間は約2倍 、自動化  の結果をより早く得られます フィードバックループを回し ソフトウェアを素早く届ける ・ビルド時間を短縮可能 なのは  ジョブを並列実行できるから ・インテリジェントにテスト  分割した上で並列実行可能  (ファイル数、ファイルサイズ、   ログからの実行時間実績で分割 ) ・インサイト機能で失敗しがち  なテストや結果が不安定なテス  トなどを抽出可能 ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja

Slide 10

Slide 10 text

10 CircleCIのドキュメント

Slide 11

Slide 11 text

11 CircleCI ドキュメントの特徴 ● オープンソース ○ テクニカルライターだけでなく、エンジニアも書く ○ 社内外からプルリクエストが来る ● 更新頻度が高い(毎日どこかのページが変更されている) ● 翻訳版は現在のところ日本語のみ

Slide 12

Slide 12 text

12 私の担当範囲 ● CircleCI ドキュメント ○ 日本語翻訳のマネジメント (社内外の翻訳者とやり取り) ○ 用語集の作成、更新 ○ スタイルガイド作成、更新 ○ 品質チェック ● changelog (リリースノート)、discuss (掲示 板)、ブログ、プロモーションページなどの翻訳 管理も担当

Slide 13

Slide 13 text

13 ここからは、ドキュメント翻訳をどのように行っているか、 まず基盤の面から紹介していきます。

Slide 14

Slide 14 text

14 CircleCI ドキュメントの基盤(GitHub)と 翻訳システム(CAT tool) GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所  だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation

Slide 15

Slide 15 text

15 こちら側は知ってる人が多いと思います GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所  だけを翻訳 ④ 翻訳結果をプッシュ

Slide 16

Slide 16 text

16 今日はCATツールの仕組みや使い方を紹介します GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所  だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation

Slide 17

Slide 17 text

17 CATツールとは 翻訳メモリ、用語集などの構成要素について

Slide 18

Slide 18 text

18 CAT (Computer-aided-translation) は、人間の翻訳をコンピューターが支援 するツール ● さまざまなファイル形式を同一のシステム上で扱うことができる ● 翻訳メモリ (TM)、用語集、機械翻訳、QAなどの機能 ● プロジェクト管理、APIなどの拡張機能を含めて TMS (Translation management system) と呼ばれることもある CATツールとは

Slide 19

Slide 19 text

19 代表的なTMS https://www.nimdzi.com/the-tms-arena-nimdzi-finger-food/ TMS: Translation Management System. CATツールにプロジェクト管理などの機能が加わったもの

Slide 20

Slide 20 text

20 文章やパラグラフ単位で過去の翻訳を蓄積したデータベース。 ソース言語とターゲット言語が対になっている。 使われ方 ● CATツールで翻訳するとき、翻訳メモリが検索され、同一または 似ている原文に対して翻訳がサジェストされる → 👍 同じ文、似た文を翻訳する手間を省ける → 👍 スタイルを統一できる ● CATツール上で翻訳すると、自動的に翻訳メモリにデータが 追加・更新される 翻訳メモリとは

Slide 21

Slide 21 text

21 翻訳料金の計算例 マッチ率 単価 ワード数 金額 100%マッチ ¥5.0 30 ¥150 85-94%マッチ ¥15.0 37 ¥555 75-84%マッチ ¥20.0 96 ¥1,920 50-74%マッチ ¥20.0 700 ¥14,000 ノーマッチ ¥20.0 1250 ¥25,000 ● 翻訳メモリがあると、翻訳 コストを下げられる場合が 多い

Slide 22

Slide 22 text

22 用語集と翻訳メモリはどう違う? ● 翻訳メモリだけあれば十分なのでは? ● 用語集はどう役に立つの?

Slide 23

Slide 23 text

23 翻訳エディター画面 (Memsourceの例) https://youtu.be/WHxxxCvNqxo ● 「96%マッチ」など、翻訳メモ リとのマッチ率つきで訳文が サジェストされる ● 用語集に登録されている語 も、訳語が示される ● 機械翻訳の結果を入れるこ ともできる

Slide 24

Slide 24 text

24 翻訳メモリと用語集 翻訳メモリ ● セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50% などの数字を出す ● コスト算出に使われる ● 翻訳することで自動的にデータが更新される 用語集 ● 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベ ルの一致を見る ● コスト算出には使われない ● 翻訳メモリのように、翻訳すれば自動的に更新されるもので はない ● 誰かが新しい用語を提案し、データベースを管理する必要が ある

Slide 25

Slide 25 text

25 用語集と翻訳メモリ つまり、 ● 翻訳メモリは、歴史的な積み上げ ● 用語集は、人手で最新に保たれた、その言語を制御する モジュール 翻訳メモリと用語集は、期待される役割が異なり、 組み合わせて使われる。

Slide 26

Slide 26 text

26 よくある使われ方 ● 用語集と翻訳メモリを組み合わせて使い、不一致があれば、用語集を優先 させる ○ 長年使われている翻訳メモリには「今はもうその言い方はしない」という 翻訳が残っている。用語集は人手で最新に保たれているので、翻訳メ モリとのコンフリクトが起こる。 この場合、用語集に従うべきとする運用が多い。 (そういう使い方をしないなら、翻訳メモリだけでいいという話になる)

Slide 27

Slide 27 text

27 翻訳メモリの運用Tips ● なるべく細かい単位で作っておく ○ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など → 👍 これにより、継続的に適切に翻訳メモリが更新される ● read (参照)と write (更新)の設定をうまく使う ○ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、 更新はマーケティングの翻訳メモリのみにする等 ● (超基本)使わない翻訳のデータは削除する → 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある

Slide 28

Slide 28 text

28  用語集の運用Tips ● 内容を最新に保つ ○ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと 全く役に立たなくなる ○ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッド シートを共有し、週1回、用語集への追加作業を実施 ● 最初は小さく始める ○ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しず つ足していく方が良い ● なるべく多くメタデータを付与する ○ 翻訳者の判断の助けになる

Slide 29

Slide 29 text

29 用語管理が不十分だとどうなる? ● 用語管理は、最初は大 変だが、後になるほど楽 になる ✌ ● やらないと、後になるほ ど大変 😱 From: https://www.slideshare.net/akashjd/prof-klaus-terminology-management

Slide 30

Slide 30 text

30  まとめ ● CircleCI ドキュメントの翻訳をどのように行っているか ● CATツールとは? ● 翻訳メモリ、用語集にはそれぞれどんな役割があるか ● 翻訳メモリ、用語集の運用Tips

Slide 31

Slide 31 text

31 Thank you.