生成系AI/LLM に関する注目アップデート ~MS Build 2023 編~

生成系AI/LLM に関する注目アップデート ~MS Build 2023 編~ 株式会社メルカリ大嶋悠司

Who am I? 大嶋@メルカリ生成AI/LLMチームテックリード

LLM!! Copilot!! PLUGIN!! AI Orchestration!!

Keynotesから

Copilot いっぱいCopilotが発表 • Windows Copilot • Microsoft 365 Copilot •
GitHub Copilot • Viva Copilot • Edge Copilot • Security Copilot • Dynamic365 Copilot

Copilot?? ばちくそにかっこいいデモ動画 (7:19 から) チャットでユーザをサポートするアプリ？

Copilot stack!!!

つまり Copilotとは： Foundation modelに支えられたアプリケーションであり、UX部分のこと

Plugin CopilotたちはPluginで拡張が可能になる！

ChatGPT Plugins

Plugin が互換に

どこでもPluginの恩恵を受けられるように

Office365 Copilotでも

Plugins

Copilot Stack

Foundation models

Model catalog

AI Orchestration

Grounding

Grounding ある証拠に基づいて（Ground）生成する

Orchestration

Prompt Flow

Orchestration

Safety

Keynotes だけじゃない！深掘りセッションズ

Foundation models

State of GPT

GPT学習パイプライン

GPT学習パイプライン事前学習言語モデル GPT(ベースモデル)やLLAMA 大規模な言語資源で LMを事前学習トークナイザなどもここで決まる

GPT学習パイプライン SFTモデル Vicuna-13Bなど QAの形式になっている少量・高品質のデータでのチューニング（数万オーダー） Instruction tuningともいう「Assistant」にする学習

GPT学習パイプライン RLHF ChatGPT, Claude 生成された回答を人手でランキング付け強化学習によって「より良い」回答を学習

なぜRLHFが必要なのか

なぜRLHFが必要なのか A: いい感じに動くから

なぜRLHFが必要なのか A: いい感じに動くから [2203.02155] Training language models to follow instructions
with human feedback

なぜRLHFが必要なのか A: いい感じに動くから [2203.02155] Training language models to follow instructions
with human feedback 生成よりも比較のほうが簡単であるという非対称が潜在的な理由かも

RLHFによる悪影響

LLM使用のベストプラクティス • Chain of Thought (CoT) : “Let’s think step
by step” • Self-consistency : 複数の答えから選ばせる • ASK for Reflection : “Was the task accomplished?” • Tree of Thought : 複数の結果を維持し、うまくいったものを残す • 「Expertとして振る舞ってください」

検索による拡張

Grounding

Vector Search Isn’t Enough by Elastic

Embeddingとは

Vector search!

Hybrid search

Metaprompt / response Filtering

Vector search / Hybrid searchは当たり前になりつつある • Elastic search • Azure
cognitive search • Azure Cosmos DB • VartexAI matching engine • Pinecone • Qdrant • …

Build and maintain your company Copilot with Azure ML and
GPT-4

Retrieval Augmented Generation (RAG)

PromptFlow

PromptFlow • プロンプトのバージョニングをしたり • Groudness(どれだけデータに基づいているか )を測ったり

まとめ • Copilot Stackという整理されたマップをもらった ◦ Frontend, Orchestration などどこに当てはまるのかを整理すると責任がわかりやすい • 現状のLLMに関しても整理された
◦ パラメータ数だけでなくどのフェーズのモデルなのかが重要 ◦ ユースケースに合ったモデル選択 • VectorSeach, PromptFlowなどのOrchestrationツール ◦ Azureに今後充実していく

メルカリでの取り組み

複数のモデルに対応

社内での活用・習熟を促進

社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索

Search 自然言語での質問/検索どの粒度でベクトル化を行うか • チャンクに切る • サマライズする • インストラクションつける

Search 自然言語での質問/検索質問とドキュメントのドメインの差 • FAQであれば問題にならない • Two tower modelなどの導入

生成AI/LLM @メルカリ　絶賛募集中！生成AI LLM専任チーム Software Engineer(Full Stack) - Mercari (
https://apply.workable.com/mercari/j/76EB5EB641/ ) 生成AI/LLM専任チーム Senior Product Manager - Mercari ( https://apply.workable.com/mercari/j/57A4BBD796/ )

生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~

生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~

More Decks by oshima

Featured

Transcript

生成系AI/LLM に関する注目アップデート ~MS Build 2023 編~

生成系AI/LLM に関する注目アップデート ~MS Build 2023 編~