Upgrade to Pro — share decks privately, control downloads, hide ads and more …

「コミュニティ」X「テクノロジー」で翻訳をReinvent(再発明)する ー コミュニティ翻訳をより楽しく、気合が入る作業にするための新提案

「コミュニティ」X「テクノロジー」で翻訳をReinvent(再発明)する ー コミュニティ翻訳をより楽しく、気合が入る作業にするための新提案

2021年4月22日「翻訳作業をもっと楽しくする Meetup by Hyperledger Fabric ドキュメント日本語翻訳グループ」発表資料 https://www.meetup.com/ja-JP/Collaborative-Translation-Meetup/events/277408780/

講演者 : 福安 徳晃 氏
Linux Foundation, Vice President of Japan Operations

概要 :
多くの開発者にとって、コミュニティ活動の楽しみはドキュメントではなくコードを書くことなので、開発者コミュニティはドキュメントを書くことに消極的になりがちです。これが翻訳作業になると、さらに及び腰になります。しかし、ドキュメントを翻訳することは、ローカルな開発者コミュニティやエコシステム、ゆくゆくはユーザーの成長に欠かせない重要な作業です。
本講演では、翻訳作業をもっと楽しく生産的にして、多くの人が参加したくなるようにするにはどうしたらいいか?ツール (技術) とワーキングプロセス (コミュニティ) を活用した解決策を提案します。

Linux Foundation Japan
PRO

April 27, 2021
Tweet

More Decks by Linux Foundation Japan

Other Decks in Technology

Transcript

  1. 「コミュニティ」x「テクノロジー」で翻訳を
    Reinvent(再発明)する:
    コミュニティ翻訳をより楽しく、気合が入る作業にするための新提案
    Noriaki Fukuyasu
    VP of Japan Operations, The Linux Foundation

    View Slide

  2. お題目
    1. 問題意識
    2. 「翻訳」という作業の未来像
    3. 翻訳を楽しく効率的に⾏うには︖(ツールなど)
    2

    View Slide

  3. 問題意識
    › 「言語の壁」が産業に与えるインパクトはでかい
    › 翻訳の進まない海外発のテクノロジは日本に広まらない = 翻訳が
    1年遅れれば日本の業界は1年遅れる
    › 全ての日本人に英語を読ませることはできない。しかしより多くの
    コンテンツをテクノロジを利用してローカライズすることは可能

    View Slide

  4. Localization
    「翻訳 (Localization)」という仕事はこの先どうなるか?
    - 作業内容の観点から -
    今日:多くは人の仕事
    = 創造性や専門性が必要
    = 高付加価値
    = 英語力のみが要件
    =低付加価値
    Interpretation
    Translation
    = 創造性や専門性が必要
    = 高付加価値
    = 英語力のみが要件
    =低付加価値
    Interpretation
    Translation
    将来:多くは機械の仕事
    Localization

    View Slide

  5. Localization
    Translation tools
    Machin Translation Engine=Non-
    Core Competence
    =No need to re-invent wheels
    みんなが使える機械翻訳やツールのOpen/Common
    Platform が欲しい!
    = 創造性や専門性が必要
    = 高付加価値
    = 英語力のみが要件
    =低付加価値
    Interpretation
    Translation
    将来:多くは機械の仕事

    View Slide

  6. これから必要なことは?
    1. みんなで共通のツールを使い、翻訳メモリをシェアする
    2. OSS業界に最適化された翻訳エンジンを育てる
    3. それぞれのOSSコミュニティに高付加価値な翻訳
    「Interpretation」を行う人材を増やす
    +翻訳はコミュニティで行い、成果をシェアする、という基本理解
    の醸成

    View Slide

  7. 「翻訳メモリ」とは?またそれがなぜ重要なのか?
    › 翻訳メモリ[1][2](英: translation memory)は、原文と翻訳文
    を一対としてデータベース化し、その内容を自動的に繰り返
    し利用することで翻訳を支援する翻訳支援ツールである。
    › 翻訳メモリには、Translation Memory eXchange (TMX) と呼
    ばれる標準的なフォーマットがあり、他者との共有が比較的
    用意。
    › 翻訳メモリを利用することによって以下の利点が得られる:
    ● 同じ文章を繰り返し翻訳する
    ● 文章を手作業で複製し貼り付ける
    ● 同じ文章や類似した文章の翻訳における表現の統一も自
    動化されるため、文書全体としての翻訳品質の向上も期
    待できる。
    (以上出典: Wikipedia)
    7/2/20
    The Linux Foundation Internal Use Only 7

    View Slide

  8. 翻訳メモリによって翻訳の仕方がどのように変化するか?
    7/2/20
    The Linux Foundation Internal Use Only 8
    コミュニティ
    の翻訳メモリ
    を入手
    翻訳メモリを
    利用して翻訳
    新しい翻訳メ
    モリの共有
    新しい翻訳メ
    モリを既存の
    翻訳メモリと
    統合
    コミュニティ
    の翻訳メモリ
    を更新

    View Slide

  9. 翻訳メモリによって翻訳の仕方がどのように変化するか?
    7/2/20
    The Linux Foundation Internal Use Only 9
    このサイクルを回すことに
    より、コミュニティはより最
    適化された翻訳メモリを獲得
    でき、翻訳作業の「だぶり」
    を解消できる
    コミュニティ
    の翻訳メモリ
    を入手
    翻訳メモリを
    利用して翻訳
    新しい翻訳メ
    モリの共有
    新しい翻訳メ
    モリを既存の
    翻訳メモリと
    統合
    コミュニティ
    の翻訳メモリ
    を更新

    View Slide

  10. 翻訳ツールのご紹介
    10

    View Slide

  11. 翻訳支援ツール: OmegaT
    › OSSの翻訳支援ツール
    › MS OfficeやHTMLなど30以上のドキュメント
    フォーマットに対応している。
    › Google翻訳やDeepLなど、一般的によく利用
    されるオンライン機械翻訳エンジンとの連携
    が可能。
    › グループ作業に適している
    › (利用方法の習得が難しい)
    7/2/20
    The Linux Foundation Internal Use Only 11

    View Slide

  12. 翻訳支援ツール: 「みんなの自動翻訳」
    › 情報通信機構 (NICT)が開発し、オン
    ラインで提供している機械翻訳ツール 。
    › オープンソースのコミュニティが翻訳に利用
    し、その成果を公開することが明確に認めら
    れている。
    › オンラインのツールなので、インストール不

    › Omega-Tのように多様なドキュメントフォー
    マットに対応しており、しかもWYSIWYGモ
    ードあり。
    › 機械翻訳エンジンなので「翻訳メモリ」を自
    動的に統合します。
    › (グループ翻訳機能がやや弱め)
    7/2/20
    The Linux Foundation Internal Use Only 12

    View Slide

  13. コミュニティ翻訳の事例:
    Hyperledger Japanese Documentation Working Group
    › Hyperledger Fabric Japanese Documentation
    Working Group
    › Githubを利用した、コミュニティ翻訳を
    実践
    › 翻訳メモリの共有なども「一部」実践し
    、現在 Github 上でメンテされている。
    › が、各々の翻訳メモリをコミュニティに
    フィードバックしたり、マージをするこ
    とに苦戦中。
    13

    View Slide

  14. そこで、現在次の手を打っています!
    14

    View Slide

  15. NICT と LF で「みんなの自動翻訳」のOSSコミュニティでの利用に
    関して協業を発表!
    › NICTより「みんなの自動翻訳」の技術提供を受け、LFのサーバに「みんなの自
    動翻訳」を実装し、OSSコミュニティのみなさんにご利用頂きます。それにより
    、「OSSでの利用に最適化した翻訳エンジン」への育てていく取り組みです。
    › 「みんなの自動翻訳」では、手作業による「翻訳メモリ」の統合作業が存在しな
    いので、現在 HL Fabricの翻訳グループが直面している課題が解決されます。
    › 文章が自動翻訳されますので、コミュニティ翻訳者はレビューと
    「Interpretation」にフォーカスできます。
    › 現在課題である「グループワーク機能」もNICTとLFで協力し、解決していく方
    向性です。
    15

    View Slide

  16. OSS利用に最適化した翻訳エンジンによって、翻訳プロセスが以下
    のように変わります!
    16
    Get the
    Community
    TM
    Translate
    using the
    TM
    Share the
    new TM
    with
    Community
    Merge the
    new TM
    with the
    existing TM
    Update the
    community
    TM
    機械翻訳が無い場合
    このステップは手作
    業です

    View Slide

  17. The value of using “optimized” machine translation engine
    17
    Get the
    Community
    TM
    Translate
    using the
    TM
    Share the
    new TM
    with
    Community
    Merge the
    new TM
    with the
    existing TM
    Update the
    community
    TM
    機械翻訳の活用により、
    コミュニティ翻訳の作業
    の多くが自動化されます

    View Slide

  18. コミュニティの活性化:
    命題=どうすれば翻訳の効率を高めたり、翻訳者のモチベーションを向上でき
    るか?
    › 翻訳成果シェアの仕組み:
    › レポジトリ – Githubを使いコミュニティ翻訳
    › ワークプロセス – メンテナが必要
    › 著作権の整理 – CLAの整備
    › コミュニティ翻訳が楽しくなるには?
    › 自分の知識向上手応え
    › 他者とのコラボレーション(評価/感謝/フィードバック)
    18

    View Slide

  19. Please join!
    Collaborative Translation Meetup (Japanese):
    https://www.meetup.com/ja-JP/Collaborative-Translation-Meetup/
    Reach me out at my twitter account:
    @nori_fukuyasu
    19

    View Slide

  20. 最後に一言:

    View Slide

  21. 万国の翻訳者よ団結せよ

    View Slide

  22. 万国の翻訳者よ団結せよ
    (そして翻訳メモリをシェアしよう!)

    View Slide

  23. THANK YOU!
    7/2/20
    The Linux Foundation Internal Use Only 23

    View Slide

  24. Legal Notices
    7/2/20
    The Linux Foundation Internal Use Only 24
    The Linux Foundation, The Linux Foundation logos, and other marks that may be used herein are owned by The Linux Foundation or its affiliated entities, and are subject to
    The Linux Foundation’s Trademark Usage Policy at https://www.linuxfoundation.org/trademark-usage, as may be modified from time to time.
    Linux is a registered trademark of Linus Torvalds. Please see the Linux Mark Institute’s trademark usage page at https://lmi.linuxfoundation.org for details regarding use of
    this trademark.
    Some marks that may be used herein are owned by projects operating as separately incorporated entities managed by The Linux Foundation, and have their own
    trademarks, policies and usage guidelines.
    TWITTER, TWEET, RETWEET and the Twitter logo are trademarks of Twitter, Inc. or its affiliates.
    Facebook and the “f” logo are trademarks of Facebook or its affiliates.
    LinkedIn, the LinkedIn logo, the IN logo and InMail are registered trademarks or trademarks of LinkedIn Corporation and its affiliates in the United States and/or other
    countries.
    YouTube and the YouTube icon are trademarks of YouTube or its affiliates.
    All other trademarks are the property of their respective owners. Use of such marks herein does not represent affiliation with or authorization, sponsorship or approval by
    such owners unless otherwise expressly specified.
    The Linux Foundation is subject to other policies, including without limitation its Privacy Policy at https://www.linuxfoundation.org/privacy and its Antitrust Policy at
    https://www.linuxfoundation.org/antitrust-policy. each as may be modified from time to time. More information about The Linux Foundation’s policies is available at
    https://www.linuxfoundation.org.
    Please email [email protected] with any questions about The Linux Foundation’s policies or the notices set forth on this slide.

    View Slide