Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~
Search
oshima
June 01, 2023
5
2.5k
生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~
oshima
June 01, 2023
Tweet
Share
More Decks by oshima
See All by oshima
CCSE2023 大規模言語モデルのZero-shot Learningを用いたデータ構築と開発への応用
yujioshima
2
430
メルカリのLLMを使ったサービス開発の進め方
yujioshima
0
260
MLOps勉強会 そのEdgeAIはUXを 改善できるか
yujioshima
1
1.2k
Mercar Gears MercariにおけるEdgeAIについて
yujioshima
0
200
CCSE2020 メルカリにおけるEdgeAIを用いた 新たなUXの開発
yujioshima
0
300
MLSE モバイル向け機械学習モデル管理基盤
yujioshima
2
3.2k
Featured
See All Featured
Mobile First: as difficult as doing things right
swwweet
222
9k
4 Signs Your Business is Dying
shpigford
181
21k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
45
2.2k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
2.9k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.3k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
810
Designing for humans not robots
tammielis
250
25k
GitHub's CSS Performance
jonrohan
1030
460k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
44
9.3k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
665
120k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
95
17k
Transcript
生成系AI/LLM に関する 注目 アップデート ~MS Build 2023 編~ 株式会社メルカリ 大嶋悠司
Who am I? 大嶋@メルカリ 生成AI/LLMチーム テックリード
LLM!! Copilot!! PLUGIN!! AI Orchestration!!
Keynotesから
None
None
Copilot いっぱいCopilotが発表 • Windows Copilot • Microsoft 365 Copilot •
GitHub Copilot • Viva Copilot • Edge Copilot • Security Copilot • Dynamic365 Copilot
Copilot?? ばちくそにかっこいいデモ動画 (7:19 から) チャットでユーザをサポートするアプリ?
Copilot stack!!!
つまり Copilotとは: Foundation modelに支えられたアプリケーションであり、UX部分のこと
Plugin CopilotたちはPluginで拡張が可能になる!
ChatGPT Plugins
Plugin が互換に
どこでもPluginの恩恵を受けられるように
Office365 Copilotでも
Plugins
Copilot Stack
Foundation models
Model catalog
AI Orchestration
AI Orchestration
Grounding
Grounding ある証拠に基づいて(Ground)生成する
Orchestration
Prompt Flow
Prompt Flow
Orchestration
Safety
Keynotes だけじゃない! 深掘りセッションズ
Foundation models
State of GPT
GPT学習パイプライン
GPT学習パイプライン 事前学習言語モデル GPT(ベースモデル)やLLAMA 大規模な言語資源で LMを事前学習 トークナイザなどもここで決まる
GPT学習パイプライン SFTモデル Vicuna-13Bなど QAの形式になっている少量・高品質のデータ でのチューニング(数万オーダー) Instruction tuningともいう 「Assistant」にする学習
GPT学習パイプライン RLHF ChatGPT, Claude 生成された回答を人手でランキング付け 強化学習によって「より良い」回答を学習
なぜRLHFが必要なのか
なぜRLHFが必要なのか A: いい感じに動くから
なぜRLHFが必要なのか A: いい感じに動くから [2203.02155] Training language models to follow instructions
with human feedback
なぜRLHFが必要なのか A: いい感じに動くから [2203.02155] Training language models to follow instructions
with human feedback 生成よりも比較のほうが簡単であるという非対称 が潜在的な理由かも
RLHFによる悪影響
LLM使用のベストプラクティス • Chain of Thought (CoT) : “Let’s think step
by step” • Self-consistency : 複数の答えから選ばせる • ASK for Reflection : “Was the task accomplished?” • Tree of Thought : 複数の結果を維持し、うまくいったものを残す • 「Expertとして振る舞ってください」
検索による拡張
Grounding
Vector Search Isn’t Enough by Elastic
Embeddingとは
Vector search!
Hybrid search
Metaprompt / response Filtering
Vector search / Hybrid searchは当たり前になりつつある • Elastic search • Azure
cognitive search • Azure Cosmos DB • VartexAI matching engine • Pinecone • Qdrant • …
Build and maintain your company Copilot with Azure ML and
GPT-4
Retrieval Augmented Generation (RAG)
None
PromptFlow
PromptFlow • プロンプトのバージョニングをしたり • Groudness(どれだけデータに基づいているか )を測ったり
まとめ • Copilot Stackという整理されたマップをもらった ◦ Frontend, Orchestration などどこに当てはまるのかを整理すると責任がわかりやすい • 現状のLLMに関しても整理された
◦ パラメータ数だけでなくどのフェーズのモデルなのかが重要 ◦ ユースケースに合ったモデル選択 • VectorSeach, PromptFlowなどのOrchestrationツール ◦ Azureに今後充実していく
メルカリでの取り組み
複数のモデルに対応
社内での活用・習熟を促進
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索 どの粒度でベクトル化を行うか • チャンクに切る • サマライズする • インストラクションつける
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索 質問とドキュメントのドメインの差 • FAQであれば問題にならない • Two tower modelなどの導入
生成AI/LLM @メルカリ 絶賛募集中! 生成AI LLM専任チーム Software Engineer(Full Stack) - Mercari (
https://apply.workable.com/mercari/j/76EB5EB641/ ) 生成AI/LLM専任チーム Senior Product Manager - Mercari ( https://apply.workable.com/mercari/j/57A4BBD796/ )