Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「コミュニティ」X「テクノロジー」で翻訳をReinvent(再発明)する ー コミュニティ翻訳をより楽しく、気合が入る作業にするための新提案

「コミュニティ」X「テクノロジー」で翻訳をReinvent(再発明)する ー コミュニティ翻訳をより楽しく、気合が入る作業にするための新提案

2021年4月22日「翻訳作業をもっと楽しくする Meetup by Hyperledger Fabric ドキュメント日本語翻訳グループ」発表資料 https://www.meetup.com/ja-JP/Collaborative-Translation-Meetup/events/277408780/

講演者 : 福安 徳晃 氏
Linux Foundation, Vice President of Japan Operations

概要 :
多くの開発者にとって、コミュニティ活動の楽しみはドキュメントではなくコードを書くことなので、開発者コミュニティはドキュメントを書くことに消極的になりがちです。これが翻訳作業になると、さらに及び腰になります。しかし、ドキュメントを翻訳することは、ローカルな開発者コミュニティやエコシステム、ゆくゆくはユーザーの成長に欠かせない重要な作業です。
本講演では、翻訳作業をもっと楽しく生産的にして、多くの人が参加したくなるようにするにはどうしたらいいか?ツール (技術) とワーキングプロセス (コミュニティ) を活用した解決策を提案します。

Linux Foundation Japan

April 27, 2021
Tweet

More Decks by Linux Foundation Japan

Other Decks in Technology

Transcript

  1. Localization 「翻訳 (Localization)」という仕事はこの先どうなるか? - 作業内容の観点から - 今日:多くは人の仕事 = 創造性や専門性が必要 =

    高付加価値 = 英語力のみが要件 =低付加価値 Interpretation Translation = 創造性や専門性が必要 = 高付加価値 = 英語力のみが要件 =低付加価値 Interpretation Translation 将来:多くは機械の仕事 Localization
  2. Localization Translation tools Machin Translation Engine=Non- Core Competence =No need

    to re-invent wheels みんなが使える機械翻訳やツールのOpen/Common Platform が欲しい! = 創造性や専門性が必要 = 高付加価値 = 英語力のみが要件 =低付加価値 Interpretation Translation 将来:多くは機械の仕事
  3. 「翻訳メモリ」とは?またそれがなぜ重要なのか? › 翻訳メモリ[1][2](英: translation memory)は、原文と翻訳文 を一対としてデータベース化し、その内容を自動的に繰り返 し利用することで翻訳を支援する翻訳支援ツールである。 › 翻訳メモリには、Translation Memory

    eXchange (TMX) と呼 ばれる標準的なフォーマットがあり、他者との共有が比較的 用意。 › 翻訳メモリを利用することによって以下の利点が得られる: • 同じ文章を繰り返し翻訳する • 文章を手作業で複製し貼り付ける • 同じ文章や類似した文章の翻訳における表現の統一も自 動化されるため、文書全体としての翻訳品質の向上も期 待できる。 (以上出典: Wikipedia) 7/2/20 The Linux Foundation Internal Use Only 7
  4. 翻訳メモリによって翻訳の仕方がどのように変化するか? 7/2/20 The Linux Foundation Internal Use Only 8 コミュニティ

    の翻訳メモリ を入手 翻訳メモリを 利用して翻訳 新しい翻訳メ モリの共有 新しい翻訳メ モリを既存の 翻訳メモリと 統合 コミュニティ の翻訳メモリ を更新
  5. 翻訳メモリによって翻訳の仕方がどのように変化するか? 7/2/20 The Linux Foundation Internal Use Only 9 このサイクルを回すことに

    より、コミュニティはより最 適化された翻訳メモリを獲得 でき、翻訳作業の「だぶり」 を解消できる コミュニティ の翻訳メモリ を入手 翻訳メモリを 利用して翻訳 新しい翻訳メ モリの共有 新しい翻訳メ モリを既存の 翻訳メモリと 統合 コミュニティ の翻訳メモリ を更新
  6. 翻訳支援ツール: OmegaT › OSSの翻訳支援ツール › MS OfficeやHTMLなど30以上のドキュメント フォーマットに対応している。 › Google翻訳やDeepLなど、一般的によく利用

    されるオンライン機械翻訳エンジンとの連携 が可能。 › グループ作業に適している › (利用方法の習得が難しい) 7/2/20 The Linux Foundation Internal Use Only 11
  7. 翻訳支援ツール: 「みんなの自動翻訳」 › 情報通信機構 (NICT)が開発し、オン ラインで提供している機械翻訳ツール 。 › オープンソースのコミュニティが翻訳に利用 し、その成果を公開することが明確に認めら

    れている。 › オンラインのツールなので、インストール不 要 › Omega-Tのように多様なドキュメントフォー マットに対応しており、しかもWYSIWYGモ ードあり。 › 機械翻訳エンジンなので「翻訳メモリ」を自 動的に統合します。 › (グループ翻訳機能がやや弱め) 7/2/20 The Linux Foundation Internal Use Only 12
  8. コミュニティ翻訳の事例: Hyperledger Japanese Documentation Working Group › Hyperledger Fabric Japanese

    Documentation Working Group › Githubを利用した、コミュニティ翻訳を 実践 › 翻訳メモリの共有なども「一部」実践し 、現在 Github 上でメンテされている。 › が、各々の翻訳メモリをコミュニティに フィードバックしたり、マージをするこ とに苦戦中。 13
  9. NICT と LF で「みんなの自動翻訳」のOSSコミュニティでの利用に 関して協業を発表! › NICTより「みんなの自動翻訳」の技術提供を受け、LFのサーバに「みんなの自 動翻訳」を実装し、OSSコミュニティのみなさんにご利用頂きます。それにより 、「OSSでの利用に最適化した翻訳エンジン」への育てていく取り組みです。 ›

    「みんなの自動翻訳」では、手作業による「翻訳メモリ」の統合作業が存在しな いので、現在 HL Fabricの翻訳グループが直面している課題が解決されます。 › 文章が自動翻訳されますので、コミュニティ翻訳者はレビューと 「Interpretation」にフォーカスできます。 › 現在課題である「グループワーク機能」もNICTとLFで協力し、解決していく方 向性です。 15
  10. OSS利用に最適化した翻訳エンジンによって、翻訳プロセスが以下 のように変わります! 16 Get the Community TM Translate using the

    TM Share the new TM with Community Merge the new TM with the existing TM Update the community TM 機械翻訳が無い場合 このステップは手作 業です
  11. The value of using “optimized” machine translation engine 17 Get

    the Community TM Translate using the TM Share the new TM with Community Merge the new TM with the existing TM Update the community TM 機械翻訳の活用により、 コミュニティ翻訳の作業 の多くが自動化されます
  12. コミュニティの活性化: 命題=どうすれば翻訳の効率を高めたり、翻訳者のモチベーションを向上でき るか? › 翻訳成果シェアの仕組み: › レポジトリ – Githubを使いコミュニティ翻訳 ›

    ワークプロセス – メンテナが必要 › 著作権の整理 – CLAの整備 › コミュニティ翻訳が楽しくなるには? › 自分の知識向上手応え › 他者とのコラボレーション(評価/感謝/フィードバック) 18
  13. Legal Notices 7/2/20 The Linux Foundation Internal Use Only 24

    The Linux Foundation, The Linux Foundation logos, and other marks that may be used herein are owned by The Linux Foundation or its affiliated entities, and are subject to The Linux Foundation’s Trademark Usage Policy at https://www.linuxfoundation.org/trademark-usage, as may be modified from time to time. Linux is a registered trademark of Linus Torvalds. Please see the Linux Mark Institute’s trademark usage page at https://lmi.linuxfoundation.org for details regarding use of this trademark. Some marks that may be used herein are owned by projects operating as separately incorporated entities managed by The Linux Foundation, and have their own trademarks, policies and usage guidelines. TWITTER, TWEET, RETWEET and the Twitter logo are trademarks of Twitter, Inc. or its affiliates. Facebook and the “f” logo are trademarks of Facebook or its affiliates. LinkedIn, the LinkedIn logo, the IN logo and InMail are registered trademarks or trademarks of LinkedIn Corporation and its affiliates in the United States and/or other countries. YouTube and the YouTube icon are trademarks of YouTube or its affiliates. All other trademarks are the property of their respective owners. Use of such marks herein does not represent affiliation with or authorization, sponsorship or approval by such owners unless otherwise expressly specified. The Linux Foundation is subject to other policies, including without limitation its Privacy Policy at https://www.linuxfoundation.org/privacy and its Antitrust Policy at https://www.linuxfoundation.org/antitrust-policy. each as may be modified from time to time. More information about The Linux Foundation’s policies is available at https://www.linuxfoundation.org. Please email [email protected] with any questions about The Linux Foundation’s policies or the notices set forth on this slide.