LLMでの多言語対応どうする問題

LLMでの多言語対応どうする問題 Haruya Umemoto 2025/03/06 1

自己紹介梅本晴弥 (Haruya Umemoto) Career • 2021~, TC3株式会社 AI事業責任者
& AI研究開発 • 2020, Arithmer株式会社 AIエンジニア(NLP) • ~2020, 青山学院大学大学院知能情報コース専門分野: 強化学習、深層学習（NLP, CV）、レコメンド、マルチモーダル X: @mumeco_ml 2 Technologies • バックエンド(Python, Rust) • インフラ(GC, AWS) • フロントエンド(React, Typescript) • アプリ開発(Flutter, Dart, Firebase)

多言語対応しているサービスで利用する LLMのプロンプトをどのように実装するのかという問題 3 （すみません、私が名づけました） LLMの多言語対応どうする問題とは？サービスの性質、利用LLM等で大きく変わるので正解は一つじゃない

4 LLMの多言語対応どうする問題リクエスト（言語A）プロンプト言語（言語A）レスポンス（言語A）プロンプト言語（言語B）
翻訳翻訳サービスバックエンド

5 * GPT-4 Technical Report, https://arxiv.org/abs/2303.08774 LLMの性能は英語が圧倒的に強い言語性能英語
85.5% 日本語 79.9% タイ語 71.8% 抜粋英語はリソースが沢山あるため

6 プロンプト戦略 * Breaking the Language Barrier: Can Direct Inference
Outperform Pre-Translation in Multilingual LLM Applications? https://arxiv.org/ftp/arxiv/papers/2403/2403.04792.pdf 1. ユーザ言語でプロンプトを作る • 実装が簡単だが、対応言語が増えると負荷が高い • 言語によっては精度が低くなる

Outperform Pre-Translation in Multilingual LLM Applications? https://arxiv.org/ftp/arxiv/papers/2403/2403.04792.pdf 1. ユーザ言語でプロンプトを作る • 実装が簡単だが、対応言語が増えると負荷が高い • 言語によっては精度が低くなる 2. 英語でプロンプトを作り、別プロンプトで結果を翻訳する • 事前翻訳*、事後翻訳が必要になり、呼び出し回数が増える • 英語動作で精度が高い

Outperform Pre-Translation in Multilingual LLM Applications? https://arxiv.org/ftp/arxiv/papers/2403/2403.04792.pdf 1. ユーザ言語でプロンプトを作る • 実装が簡単だが、対応言語が増えると負荷が高い • 言語によっては精度が低くなる 2. 英語でプロンプトを作り、別プロンプトで結果を翻訳する • 事前翻訳*、事後翻訳が必要になり、呼び出し回数が増える • 英語動作で精度が高い 3. 英語でプロンプトを実装し、翻訳指示も埋め込む • 精度が高く呼び出し回数を抑えられる • 翻訳指示に従わずに英語で出力されるリスク

Outperform Pre-Translation in Multilingual LLM Applications? https://arxiv.org/ftp/arxiv/papers/2403/2403.04792.pdf 1. ユーザ言語でプロンプトを作る • 実装が簡単だが、対応言語が増えると負荷が高い • 言語によっては精度が低くなる 2. 英語でプロンプトを作り、別プロンプトで結果を翻訳する • 事前翻訳*、事後翻訳が必要になり、呼び出し回数が増える • 英語動作で精度が高い 3. 英語でプロンプトを実装し、翻訳指示も埋め込む • 精度が高く呼び出し回数を抑えられる • 翻訳指示に従わずに英語で出力されるリスクこれが最適？

結論プロンプトは全部英語で書くのが良い！ 10

私が開発しているアプリで悩んだケースがあります 11

AI旅行プラン生成アプリ Tripia 12 あなたの完璧な旅行をAIがデザインしより価値のある思い出に全世界のエリアどこでも対応知られていない隠れスポットも提案超高精度な旅行プラン生成性能時間や費用に応じたプラン設計海外旅行したい！リラックスしたい
食べ歩きしたいお寺を回りたい！有名スポットにいきたい！ “AIが旅行の計画を立てる新時代へ。あなたの要望に従い、理想的な旅行プランを提案します。”

Tripia デモ 13 旅行の要望をしっかり反映させた旅行プランが生成可能

Tripiaではマイナーなエリア情報も取り扱う 14 LLMにはマイナーなエリア情報の知識を持っていてほしい仮説: 以下の状況では英語の性能は下がってしまう 1. 日本のマイナーなエリアを対象に知識を問う 2. 日本語の情報はある 3.
外国人がほとんど訪れないため英語情報がない

15 実験: マイナーな場所の知識を聞いてみた(Gemini) 秩父の滝沢ダム以下の質問を３回繰り返し表示されたスポットを比較

16 実験結果赤マーカー：日本語黄マーカー：英語日本語と英語で提示スポットが大きく変わった! 日本語ではダム近くのスポット提示英語では秩父でのスポット提示

1. 複数のプロンプト戦略があるが、基本英語が強い 2. ただし、特定言語に偏った情報領域では違う結果にもなりうる 17 LLMの多言語対応どうする問題まとめサービス、利用LLM等で結果は大きく変わるので評価実験が大切

18 ご清聴ありがとうございました！ X: @mumeco_ml ←フォローしてもらえると嬉しいです!! 気になった点があれば、この後ぜひ声かけてください🙇

LLMでの多言語対応どうする問題

LLMでの多言語対応どうする問題

umeco

More Decks by umeco

Featured

Transcript