Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ドキュメントの翻訳に必要なこと
Search
Mayuko Sawai
May 15, 2022
Technology
0
870
ドキュメントの翻訳に必要なこと
LINE Technical Writing Meetup vol.13 (2022/5/12)での発表資料です。
Mayuko Sawai
May 15, 2022
Tweet
Share
More Decks by Mayuko Sawai
See All by Mayuko Sawai
テクニカルライターに必要な知識を学べる大学院の紹介/Introduction Master TCLoc
mayukosawai
2
1k
Other Decks in Technology
See All in Technology
技術選定、下から見るか?横から見るか?
masakiokuda
0
170
意外と知らない状態遷移テストの世界
nihonbuson
PRO
1
380
「もしもデータ基盤開発で『強くてニューゲーム』ができたなら今の僕はどんなデータ基盤を作っただろう」
aeonpeople
0
270
人工知能のための哲学塾 ニューロフィロソフィ篇 第零夜 「ニューロフィロソフィとは何か?」
miyayou
0
220
[PR] はじめてのデジタルアイデンティティという本を書きました
ritou
0
660
AI with TiDD
shiraji
1
330
投資戦略を量産せよ 2 - マケデコセミナー(2025/12/26)
gamella
0
560
アラフォーおじさん、はじめてre:Inventに行く / A 40-Something Guy’s First re:Invent Adventure
kaminashi
0
210
ペアーズにおけるAIエージェント 基盤とText to SQLツールの紹介
hisamouna
2
2k
[Neurogica] 採用ポジション/ Recruitment Position
neurogica
1
140
2025年 山梨の技術コミュニティを振り返る
yuukis
0
140
AR Guitar: Expanding Guitar Performance from a Live House to Urban Space
ekito_station
0
270
Featured
See All Featured
Data-driven link building: lessons from a $708K investment (BrightonSEO talk)
szymonslowik
1
860
Stop Working from a Prison Cell
hatefulcrawdad
273
21k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
100
Measuring Dark Social's Impact On Conversion and Attribution
stephenakadiri
1
99
Facilitating Awesome Meetings
lara
57
6.7k
Automating Front-end Workflow
addyosmani
1371
200k
Max Prin - Stacking Signals: How International SEO Comes Together (And Falls Apart)
techseoconnect
PRO
0
56
Exploring anti-patterns in Rails
aemeredith
2
220
Documentation Writing (for coders)
carmenintech
77
5.2k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
38
Speed Design
sergeychernyshev
33
1.5k
Transcript
1 ドキュメントの翻訳に 必要なこと 澤井 真佑子 Technical Writer, CircleCI
2 本日の発表 • このような方向け ◦ ドキュメントの翻訳を他の会社はどうやっているのか聞 いてみたい ◦ どんな準備やツールが必要か知りたい
3 • ドキュメントサイトの翻訳をどの ように行っているか? • 翻訳に使われるCATツール、翻 訳メモリや用語集の扱い方 など お話しする内容
4 自己紹介 • 名前:澤井 真佑子 / Mayuko Sawai Technical Writer
@ CircleCI (2021.12 〜) • 経歴 ◦ 前職はサイボウズのテクニカルライター • ストラスブール大学のオンライン修士課程で Technical communication & Localization を 勉強中 (LINE TWM vol.7 で紹介) 「テクニカルライターが働きながら学ぶ大学院を紹介します」 https://blog.cybozu.io/entry/2021/09/10/084825
5 CircleCIの紹介
6 CircleCIの概要
7 Continuous Integration(継続的インテグレーション) • コードの変更を迅速かつ安全に マージできる ◦ ビルド ◦ コード解析
◦ 自動化されたテスト ◦ 脆弱性チェック • 効果 ◦ 手戻りの防止 ◦ リリース品質の向上 ◦ 長期的なコスト削減
8 Continuous Deployment(継続的デプロイメント) • コードの変更を迅速かつ 安全に展開・配信する • 効果 ◦ 人手によるミスの防止
◦ 素早いユーザーへの 価値提供
9 Free プランでも十分なビルド時間で自動化可能 Free プランでも 十分なビルド時間で自動化可能 ・毎月6,000分相当のクレジッ トを付与、最適なリソース クラス (CPU/RAM)
を選択可能 ・ユーザー数は無制限 だから チーム開発にも適用可能 ・パワフルなリソースクラス 、 Docker コンテナやVM(Linux, Windows, Mac)を利用可能 同じ時間枠でも CircleCI なら 利用可能な機能がこんなにも ・スピードとパフォーマンスが 向上、Docker コンテナを最適化 ・ビルドがより高速化 、 同時に30並列実行まで可能 ・プライベート Orb で CI/CD も コラボレーション 、設定の 部品化、組織内での再利用可能 ・ビルド時間は約2倍 、自動化 の結果をより早く得られます フィードバックループを回し ソフトウェアを素早く届ける ・ビルド時間を短縮可能 なのは ジョブを並列実行できるから ・インテリジェントにテスト 分割した上で並列実行可能 (ファイル数、ファイルサイズ、 ログからの実行時間実績で分割 ) ・インサイト機能で失敗しがち なテストや結果が不安定なテス トなどを抽出可能 ユーザー登録: https://circleci.com/ja/signup/ 料金プラン: https://circleci.com/ja/pricing/ サポート: https://support.circleci.com/hc/ja
10 CircleCIのドキュメント
11 CircleCI ドキュメントの特徴 • オープンソース ◦ テクニカルライターだけでなく、エンジニアも書く ◦ 社内外からプルリクエストが来る •
更新頻度が高い(毎日どこかのページが変更されている) • 翻訳版は現在のところ日本語のみ
12 私の担当範囲 • CircleCI ドキュメント ◦ 日本語翻訳のマネジメント (社内外の翻訳者とやり取り) ◦ 用語集の作成、更新
◦ スタイルガイド作成、更新 ◦ 品質チェック • changelog (リリースノート)、discuss (掲示 板)、ブログ、プロモーションページなどの翻訳 管理も担当
13 ここからは、ドキュメント翻訳をどのように行っているか、 まず基盤の面から紹介していきます。
14 CircleCI ドキュメントの基盤(GitHub)と 翻訳システム(CAT tool) GitHub 記事ファイル テクニカル ライター 社内コントリ
ビューター 社外コントリビュー ター CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
15 こちら側は知ってる人が多いと思います GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ
16 今日はCATツールの仕組みや使い方を紹介します GitHub 記事ファイル テクニカル ライター 社内コントリ ビューター 社外コントリビュー ター
CAT Tool 翻訳メモリー 翻訳者 翻訳者 En Ja ① 記事をプッシュ ② 定期的にSync ③ 原文の変更箇所 だけを翻訳 ④ 翻訳結果をプッシュ CAT: Computer-aided translation
17 CATツールとは 翻訳メモリ、用語集などの構成要素について
18 CAT (Computer-aided-translation) は、人間の翻訳をコンピューターが支援 するツール • さまざまなファイル形式を同一のシステム上で扱うことができる • 翻訳メモリ (TM)、用語集、機械翻訳、QAなどの機能
• プロジェクト管理、APIなどの拡張機能を含めて TMS (Translation management system) と呼ばれることもある CATツールとは
19 代表的なTMS https://www.nimdzi.com/the-tms-arena-nimdzi-finger-food/ TMS: Translation Management System. CATツールにプロジェクト管理などの機能が加わったもの
20 文章やパラグラフ単位で過去の翻訳を蓄積したデータベース。 ソース言語とターゲット言語が対になっている。 使われ方 • CATツールで翻訳するとき、翻訳メモリが検索され、同一または 似ている原文に対して翻訳がサジェストされる → 👍 同じ文、似た文を翻訳する手間を省ける
→ 👍 スタイルを統一できる • CATツール上で翻訳すると、自動的に翻訳メモリにデータが 追加・更新される 翻訳メモリとは
21 翻訳料金の計算例 マッチ率 単価 ワード数 金額 100%マッチ ¥5.0 30 ¥150
85-94%マッチ ¥15.0 37 ¥555 75-84%マッチ ¥20.0 96 ¥1,920 50-74%マッチ ¥20.0 700 ¥14,000 ノーマッチ ¥20.0 1250 ¥25,000 • 翻訳メモリがあると、翻訳 コストを下げられる場合が 多い
22 用語集と翻訳メモリはどう違う? • 翻訳メモリだけあれば十分なのでは? • 用語集はどう役に立つの?
23 翻訳エディター画面 (Memsourceの例) https://youtu.be/WHxxxCvNqxo • 「96%マッチ」など、翻訳メモ リとのマッチ率つきで訳文が サジェストされる • 用語集に登録されている語
も、訳語が示される • 機械翻訳の結果を入れるこ ともできる
24 翻訳メモリと用語集 翻訳メモリ • セグメント(文章やパラグラフ)全体にマッチさせ、85% 、50% などの数字を出す • コスト算出に使われる •
翻訳することで自動的にデータが更新される 用語集 • 80%マッチなどの類似度は見ない。(通常1,2語の)単語レベ ルの一致を見る • コスト算出には使われない • 翻訳メモリのように、翻訳すれば自動的に更新されるもので はない • 誰かが新しい用語を提案し、データベースを管理する必要が ある
25 用語集と翻訳メモリ つまり、 • 翻訳メモリは、歴史的な積み上げ • 用語集は、人手で最新に保たれた、その言語を制御する モジュール 翻訳メモリと用語集は、期待される役割が異なり、 組み合わせて使われる。
26 よくある使われ方 • 用語集と翻訳メモリを組み合わせて使い、不一致があれば、用語集を優先 させる ◦ 長年使われている翻訳メモリには「今はもうその言い方はしない」という 翻訳が残っている。用語集は人手で最新に保たれているので、翻訳メ モリとのコンフリクトが起こる。 この場合、用語集に従うべきとする運用が多い。
(そういう使い方をしないなら、翻訳メモリだけでいいという話になる)
27 翻訳メモリの運用Tips • なるべく細かい単位で作っておく ◦ 「ドキュメント」「マーケティングサイト」などのコンテンツ別、部署別など → 👍 これにより、継続的に適切に翻訳メモリが更新される •
read (参照)と write (更新)の設定をうまく使う ◦ マーケティング資料の翻訳では、ドキュメントの翻訳メモリを参照するが、 更新はマーケティングの翻訳メモリのみにする等 • (超基本)使わない翻訳のデータは削除する → 😢 削除しないと、次回以降の翻訳で再び使われる可能性がある
28 用語集の運用Tips • 内容を最新に保つ ◦ 翻訳メモリと違って自動で更新されないので、一度作ってもメンテしないと 全く役に立たなくなる ◦ CircleCI では、社内翻訳者や翻訳会社で用語登録リクエストのスプレッド
シートを共有し、週1回、用語集への追加作業を実施 • 最初は小さく始める ◦ 多すぎてコントロールしにくい状態になるより、不可欠なものだけ少しず つ足していく方が良い • なるべく多くメタデータを付与する ◦ 翻訳者の判断の助けになる
29 用語管理が不十分だとどうなる? • 用語管理は、最初は大 変だが、後になるほど楽 になる ✌ • やらないと、後になるほ ど大変
😱 From: https://www.slideshare.net/akashjd/prof-klaus-terminology-management
30 まとめ • CircleCI ドキュメントの翻訳をどのように行っているか • CATツールとは? • 翻訳メモリ、用語集にはそれぞれどんな役割があるか •
翻訳メモリ、用語集の運用Tips
31 Thank you.