生成系AI/LLM に関する 注目アップデート~MS Build 2023 編~株式会社メルカリ大嶋悠司
View Slide
Who am I?大嶋@メルカリ生成AI/LLMチーム テックリード
LLM!!Copilot!! PLUGIN!!AI Orchestration!!
Keynotesから
CopilotいっぱいCopilotが発表● Windows Copilot● Microsoft 365 Copilot● GitHub Copilot● Viva Copilot● Edge Copilot● Security Copilot● Dynamic365 Copilot
Copilot??ばちくそにかっこいいデモ動画 (7:19 から)チャットでユーザをサポートするアプリ?
Copilot stack!!!
つまりCopilotとは:Foundation modelに支えられたアプリケーションであり、UX部分のこと
PluginCopilotたちはPluginで拡張が可能になる!
ChatGPT Plugins
Plugin が互換に
どこでもPluginの恩恵を受けられるように
Office365 Copilotでも
Plugins
Copilot Stack
Foundation models
Model catalog
AI Orchestration
Grounding
Groundingある証拠に基づいて(Ground)生成する
Orchestration
Prompt Flow
Safety
Keynotes だけじゃない!深掘りセッションズ
State of GPT
GPT学習パイプライン
GPT学習パイプライン事前学習言語モデルGPT(ベースモデル)やLLAMA大規模な言語資源で LMを事前学習トークナイザなどもここで決まる
GPT学習パイプラインSFTモデルVicuna-13BなどQAの形式になっている少量・高品質のデータでのチューニング(数万オーダー)Instruction tuningともいう「Assistant」にする学習
GPT学習パイプラインRLHFChatGPT, Claude生成された回答を人手でランキング付け強化学習によって「より良い」回答を学習
なぜRLHFが必要なのか
なぜRLHFが必要なのかA: いい感じに動くから
なぜRLHFが必要なのかA: いい感じに動くから[2203.02155] Training language models to follow instructions with human feedback
なぜRLHFが必要なのかA: いい感じに動くから[2203.02155] Training language models to follow instructions with human feedback生成よりも比較のほうが簡単であるという非対称が潜在的な理由かも
RLHFによる悪影響
LLM使用のベストプラクティス● Chain of Thought (CoT) : “Let’s think step by step”● Self-consistency : 複数の答えから選ばせる● ASK for Reflection : “Was the task accomplished?”● Tree of Thought : 複数の結果を維持し、うまくいったものを残す● 「Expertとして振る舞ってください」
検索による拡張
Vector Search Isn’t Enough by Elastic
Embeddingとは
Vector search!
Hybrid search
Metaprompt / response Filtering
Vector search / Hybrid searchは当たり前になりつつある● Elastic search● Azure cognitive search● Azure Cosmos DB● VartexAI matching engine● Pinecone● Qdrant● …
Build and maintain your company Copilot with Azure ML and GPT-4
Retrieval Augmented Generation (RAG)
PromptFlow
PromptFlow● プロンプトのバージョニングをしたり● Groudness(どれだけデータに基づいているか )を測ったり
まとめ● Copilot Stackという整理されたマップをもらった○ Frontend, Orchestration などどこに当てはまるのかを整理すると責任がわかりやすい● 現状のLLMに関しても整理された○ パラメータ数だけでなくどのフェーズのモデルなのかが重要○ ユースケースに合ったモデル選択● VectorSeach, PromptFlowなどのOrchestrationツール○ Azureに今後充実していく
メルカリでの取り組み
複数のモデルに対応
社内での活用・習熟を促進
社内ドキュメント検索ConfluenceGoogle DocsSlacCognitive SearchVector searchHybrid Search自然言語での質問/検索
社内ドキュメント検索ConfluenceGoogle DocsSlacCognitive SearchVector searchHybrid Search自然言語での質問/検索どの粒度でベクトル化を行うか● チャンクに切る● サマライズする● インストラクションつける
社内ドキュメント検索ConfluenceGoogle DocsSlacCognitive SearchVector searchHybrid Search自然言語での質問/検索質問とドキュメントのドメインの差● FAQであれば問題にならない● Two tower modelなどの導入
生成AI/LLM @メルカリ 絶賛募集中!生成AI LLM専任チーム Software Engineer(Full Stack) - Mercari( https://apply.workable.com/mercari/j/76EB5EB641/ )生成AI/LLM専任チーム Senior Product Manager - Mercari( https://apply.workable.com/mercari/j/57A4BBD796/ )