$30 off During Our Annual Pro Sale. View Details »

ドキュメントの翻訳に必要なこと

 ドキュメントの翻訳に必要なこと

LINE Technical Writing Meetup vol.13 (2022/5/12)での発表資料です。

Mayuko Sawai

May 15, 2022
Tweet

More Decks by Mayuko Sawai

Other Decks in Technology

Transcript

  1. 1
    ドキュメントの翻訳に
    必要なこと
    澤井 真佑子
    Technical Writer, CircleCI

    View Slide

  2. 2
    本日の発表
    ● このような方向け
    ○ ドキュメントの翻訳を他の会社はどうやっているのか聞
    いてみたい
    ○ どんな準備やツールが必要か知りたい

    View Slide

  3. 3
    ● ドキュメントサイトの翻訳をどの
    ように行っているか?
    ● 翻訳に使われるCATツール、翻
    訳メモリや用語集の扱い方
    など
    お話しする内容

    View Slide

  4. 4
    自己紹介
    ● 名前:澤井 真佑子 / Mayuko Sawai
    Technical Writer @ CircleCI (2021.12 〜)
    ● 経歴
    ○ 前職はサイボウズのテクニカルライター
    ● ストラスブール大学のオンライン修士課程で
    Technical communication & Localization を
    勉強中 (LINE TWM vol.7 で紹介)
    「テクニカルライターが働きながら学ぶ大学院を紹介します」  
     https://blog.cybozu.io/entry/2021/09/10/084825

    View Slide

  5. 5
    CircleCIの紹介

    View Slide

  6. 6
    CircleCIの概要

    View Slide

  7. 7
    Continuous Integration(継続的インテグレーション)
    ● コードの変更を迅速かつ安全に
    マージできる
    ○ ビルド
    ○ コード解析
    ○ 自動化されたテスト
    ○ 脆弱性チェック
    ● 効果
    ○ 手戻りの防止
    ○ リリース品質の向上
    ○ 長期的なコスト削減

    View Slide

  8. 8
    Continuous Deployment(継続的デプロイメント)
    ● コードの変更を迅速かつ
    安全に展開・配信する
    ● 効果
    ○ 人手によるミスの防止
    ○ 素早いユーザーへの
    価値提供

    View Slide

  9. 9
    Free プランでも十分なビルド時間で自動化可能
    Free プランでも
    十分なビルド時間で自動化可能
    ・毎月6,000分相当のクレジッ
     トを付与、最適なリソース
     クラス (CPU/RAM) を選択可能
    ・ユーザー数は無制限 だから
     チーム開発にも適用可能
    ・パワフルなリソースクラス 、
     Docker コンテナやVM(Linux,
     Windows, Mac)を利用可能
    同じ時間枠でも CircleCI なら
    利用可能な機能がこんなにも
    ・スピードとパフォーマンスが
     向上、Docker コンテナを最適化
    ・ビルドがより高速化 、
     同時に30並列実行まで可能
    ・プライベート Orb で CI/CD も
     コラボレーション 、設定の
     部品化、組織内での再利用可能
    ・ビルド時間は約2倍 、自動化
     の結果をより早く得られます
    フィードバックループを回し
    ソフトウェアを素早く届ける
    ・ビルド時間を短縮可能 なのは
     ジョブを並列実行できるから
    ・インテリジェントにテスト
     分割した上で並列実行可能
     (ファイル数、ファイルサイズ、
      ログからの実行時間実績で分割
    )
    ・インサイト機能で失敗しがち
     なテストや結果が不安定なテス
     トなどを抽出可能
    ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja

    View Slide

  10. 10
    CircleCIのドキュメント

    View Slide

  11. 11
    CircleCI ドキュメントの特徴
    ● オープンソース
    ○ テクニカルライターだけでなく、エンジニアも書く
    ○ 社内外からプルリクエストが来る
    ● 更新頻度が高い(毎日どこかのページが変更されている)
    ● 翻訳版は現在のところ日本語のみ

    View Slide

  12. 12
    私の担当範囲
    ● CircleCI ドキュメント
    ○ 日本語翻訳のマネジメント
    (社内外の翻訳者とやり取り)
    ○ 用語集の作成、更新
    ○ スタイルガイド作成、更新
    ○ 品質チェック
    ● changelog (リリースノート)、discuss (掲示
    板)、ブログ、プロモーションページなどの翻訳
    管理も担当

    View Slide

  13. 13
    ここからは、ドキュメント翻訳をどのように行っているか、
    まず基盤の面から紹介していきます。

    View Slide

  14. 14
    CircleCI ドキュメントの基盤(GitHub)と
    翻訳システム(CAT tool)
    GitHub
    記事ファイル
    テクニカル
    ライター
    社内コントリ
    ビューター
    社外コントリビュー
    ター
    CAT Tool
    翻訳メモリー
    翻訳者
    翻訳者
    En
    Ja
    ① 記事をプッシュ
    ② 定期的にSync
    ③ 原文の変更箇所 
    だけを翻訳
    ④ 翻訳結果をプッシュ
    CAT: Computer-aided translation

    View Slide

  15. 15
    こちら側は知ってる人が多いと思います
    GitHub
    記事ファイル
    テクニカル
    ライター
    社内コントリ
    ビューター
    社外コントリビュー
    ター
    CAT Tool
    翻訳メモリー
    翻訳者
    翻訳者
    En
    Ja
    ① 記事をプッシュ
    ② 定期的にSync
    ③ 原文の変更箇所 
    だけを翻訳
    ④ 翻訳結果をプッシュ

    View Slide

  16. 16
    今日はCATツールの仕組みや使い方を紹介します
    GitHub
    記事ファイル
    テクニカル
    ライター
    社内コントリ
    ビューター
    社外コントリビュー
    ター
    CAT Tool
    翻訳メモリー
    翻訳者
    翻訳者
    En
    Ja
    ① 記事をプッシュ
    ② 定期的にSync
    ③ 原文の変更箇所 
    だけを翻訳
    ④ 翻訳結果をプッシュ
    CAT: Computer-aided translation

    View Slide

  17. 17
    CATツールとは
    翻訳メモリ、用語集などの構成要素について

    View Slide

  18. 18
    CAT (Computer-aided-translation) は、人間の翻訳をコンピューターが支援
    するツール
    ● さまざまなファイル形式を同一のシステム上で扱うことができる
    ● 翻訳メモリ (TM)、用語集、機械翻訳、QAなどの機能
    ● プロジェクト管理、APIなどの拡張機能を含めて TMS (Translation
    management system) と呼ばれることもある
    CATツールとは

    View Slide

  19. 19
    代表的なTMS
    https://www.nimdzi.com/the-tms-arena-nimdzi-finger-food/
    TMS: Translation Management System. CATツールにプロジェクト管理などの機能が加わったもの

    View Slide

  20. 20
    文章やパラグラフ単位で過去の翻訳を蓄積したデータベース。
    ソース言語とターゲット言語が対になっている。
    使われ方
    ● CATツールで翻訳するとき、翻訳メモリが検索され、同一または
    似ている原文に対して翻訳がサジェストされる
    → 👍 同じ文、似た文を翻訳する手間を省ける
    → 👍 スタイルを統一できる
    ● CATツール上で翻訳すると、自動的に翻訳メモリにデータが
    追加・更新される
    翻訳メモリとは

    View Slide

  21. 21
    翻訳料金の計算例
    マッチ率 単価 ワード数 金額
    100%マッチ ¥5.0 30 ¥150
    85-94%マッチ ¥15.0 37 ¥555
    75-84%マッチ ¥20.0 96 ¥1,920
    50-74%マッチ ¥20.0 700 ¥14,000
    ノーマッチ ¥20.0 1250 ¥25,000
    ● 翻訳メモリがあると、翻訳
    コストを下げられる場合が
    多い

    View Slide

  22. 22
    用語集と翻訳メモリはどう違う?
    ● 翻訳メモリだけあれば十分なのでは?
    ● 用語集はどう役に立つの?

    View Slide

  23. 23
    翻訳エディター画面 (Memsourceの例)
    https://youtu.be/WHxxxCvNqxo
    ● 「96%マッチ」など、翻訳メモ
    リとのマッチ率つきで訳文が
    サジェストされる
    ● 用語集に登録されている語
    も、訳語が示される
    ● 機械翻訳の結果を入れるこ
    ともできる

    View Slide

  24. 24
    翻訳メモリと用語集
    翻訳メモリ ● セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50%
    などの数字を出す
    ● コスト算出に使われる
    ● 翻訳することで自動的にデータが更新される
    用語集 ● 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベ
    ルの一致を見る
    ● コスト算出には使われない
    ● 翻訳メモリのように、翻訳すれば自動的に更新されるもので
    はない
    ● 誰かが新しい用語を提案し、データベースを管理する必要が
    ある

    View Slide

  25. 25
    用語集と翻訳メモリ
    つまり、
    ● 翻訳メモリは、歴史的な積み上げ
    ● 用語集は、人手で最新に保たれた、その言語を制御する
    モジュール
    翻訳メモリと用語集は、期待される役割が異なり、
    組み合わせて使われる。

    View Slide

  26. 26
    よくある使われ方
    ● 用語集と翻訳メモリを組み合わせて使い、不一致があれば、用語集を優先
    させる
    ○ 長年使われている翻訳メモリには「今はもうその言い方はしない」という
    翻訳が残っている。用語集は人手で最新に保たれているので、翻訳メ
    モリとのコンフリクトが起こる。
    この場合、用語集に従うべきとする運用が多い。
    (そういう使い方をしないなら、翻訳メモリだけでいいという話になる)

    View Slide

  27. 27
    翻訳メモリの運用Tips
    ● なるべく細かい単位で作っておく
    ○ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など
    → 👍 これにより、継続的に適切に翻訳メモリが更新される
    ● read (参照)と write (更新)の設定をうまく使う
    ○ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、
    更新はマーケティングの翻訳メモリのみにする等
    ● (超基本)使わない翻訳のデータは削除する
    → 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある

    View Slide

  28. 28
     用語集の運用Tips
    ● 内容を最新に保つ
    ○ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと
    全く役に立たなくなる
    ○ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッド
    シートを共有し、週1回、用語集への追加作業を実施
    ● 最初は小さく始める
    ○ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しず
    つ足していく方が良い
    ● なるべく多くメタデータを付与する
    ○ 翻訳者の判断の助けになる

    View Slide

  29. 29
    用語管理が不十分だとどうなる?
    ● 用語管理は、最初は大
    変だが、後になるほど楽
    になる ✌
    ● やらないと、後になるほ
    ど大変 😱
    From: https://www.slideshare.net/akashjd/prof-klaus-terminology-management

    View Slide

  30. 30
     まとめ
    ● CircleCI ドキュメントの翻訳をどのように行っているか
    ● CATツールとは?
    ● 翻訳メモリ、用語集にはそれぞれどんな役割があるか
    ● 翻訳メモリ、用語集の運用Tips

    View Slide

  31. 31
    Thank you.

    View Slide