Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
oshima
June 01, 2023
5
2.7k
生成系AI/LLM に関する 注目アップデート ~MS Build 2023 編~
oshima
June 01, 2023
Tweet
Share
More Decks by oshima
See All by oshima
CCSE2023 大規模言語モデルのZero-shot Learningを用いたデータ構築と開発への応用
yujioshima
2
460
メルカリのLLMを使ったサービス開発の進め方
yujioshima
0
300
MLOps勉強会 そのEdgeAIはUXを 改善できるか
yujioshima
1
1.3k
Mercar Gears MercariにおけるEdgeAIについて
yujioshima
0
260
CCSE2020 メルカリにおけるEdgeAIを用いた 新たなUXの開発
yujioshima
0
350
MLSE モバイル向け機械学習モデル管理基盤
yujioshima
2
3.3k
Featured
See All Featured
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.4k
Un-Boring Meetings
codingconduct
0
200
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
310
Dominate Local Search Results - an insider guide to GBP, reviews, and Local SEO
greggifford
PRO
0
52
My Coaching Mixtape
mlcsv
0
44
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
430
Abbi's Birthday
coloredviolet
1
4.6k
The Spectacular Lies of Maps
axbom
PRO
1
500
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
400
Code Review Best Practice
trishagee
74
20k
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
59
42k
Sam Torres - BigQuery for SEOs
techseoconnect
PRO
0
170
Transcript
生成系AI/LLM に関する 注目 アップデート ~MS Build 2023 編~ 株式会社メルカリ 大嶋悠司
Who am I? 大嶋@メルカリ 生成AI/LLMチーム テックリード
LLM!! Copilot!! PLUGIN!! AI Orchestration!!
Keynotesから
None
None
Copilot いっぱいCopilotが発表 • Windows Copilot • Microsoft 365 Copilot •
GitHub Copilot • Viva Copilot • Edge Copilot • Security Copilot • Dynamic365 Copilot
Copilot?? ばちくそにかっこいいデモ動画 (7:19 から) チャットでユーザをサポートするアプリ?
Copilot stack!!!
つまり Copilotとは: Foundation modelに支えられたアプリケーションであり、UX部分のこと
Plugin CopilotたちはPluginで拡張が可能になる!
ChatGPT Plugins
Plugin が互換に
どこでもPluginの恩恵を受けられるように
Office365 Copilotでも
Plugins
Copilot Stack
Foundation models
Model catalog
AI Orchestration
AI Orchestration
Grounding
Grounding ある証拠に基づいて(Ground)生成する
Orchestration
Prompt Flow
Prompt Flow
Orchestration
Safety
Keynotes だけじゃない! 深掘りセッションズ
Foundation models
State of GPT
GPT学習パイプライン
GPT学習パイプライン 事前学習言語モデル GPT(ベースモデル)やLLAMA 大規模な言語資源で LMを事前学習 トークナイザなどもここで決まる
GPT学習パイプライン SFTモデル Vicuna-13Bなど QAの形式になっている少量・高品質のデータ でのチューニング(数万オーダー) Instruction tuningともいう 「Assistant」にする学習
GPT学習パイプライン RLHF ChatGPT, Claude 生成された回答を人手でランキング付け 強化学習によって「より良い」回答を学習
なぜRLHFが必要なのか
なぜRLHFが必要なのか A: いい感じに動くから
なぜRLHFが必要なのか A: いい感じに動くから [2203.02155] Training language models to follow instructions
with human feedback
なぜRLHFが必要なのか A: いい感じに動くから [2203.02155] Training language models to follow instructions
with human feedback 生成よりも比較のほうが簡単であるという非対称 が潜在的な理由かも
RLHFによる悪影響
LLM使用のベストプラクティス • Chain of Thought (CoT) : “Let’s think step
by step” • Self-consistency : 複数の答えから選ばせる • ASK for Reflection : “Was the task accomplished?” • Tree of Thought : 複数の結果を維持し、うまくいったものを残す • 「Expertとして振る舞ってください」
検索による拡張
Grounding
Vector Search Isn’t Enough by Elastic
Embeddingとは
Vector search!
Hybrid search
Metaprompt / response Filtering
Vector search / Hybrid searchは当たり前になりつつある • Elastic search • Azure
cognitive search • Azure Cosmos DB • VartexAI matching engine • Pinecone • Qdrant • …
Build and maintain your company Copilot with Azure ML and
GPT-4
Retrieval Augmented Generation (RAG)
None
PromptFlow
PromptFlow • プロンプトのバージョニングをしたり • Groudness(どれだけデータに基づいているか )を測ったり
まとめ • Copilot Stackという整理されたマップをもらった ◦ Frontend, Orchestration などどこに当てはまるのかを整理すると責任がわかりやすい • 現状のLLMに関しても整理された
◦ パラメータ数だけでなくどのフェーズのモデルなのかが重要 ◦ ユースケースに合ったモデル選択 • VectorSeach, PromptFlowなどのOrchestrationツール ◦ Azureに今後充実していく
メルカリでの取り組み
複数のモデルに対応
社内での活用・習熟を促進
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索 どの粒度でベクトル化を行うか • チャンクに切る • サマライズする • インストラクションつける
社内ドキュメント検索 Confluence Google Docs Slac Cognitive Search Vector search Hybrid
Search 自然言語での質問/検索 質問とドキュメントのドメインの差 • FAQであれば問題にならない • Two tower modelなどの導入
生成AI/LLM @メルカリ 絶賛募集中! 生成AI LLM専任チーム Software Engineer(Full Stack) - Mercari (
https://apply.workable.com/mercari/j/76EB5EB641/ ) 生成AI/LLM専任チーム Senior Product Manager - Mercari ( https://apply.workable.com/mercari/j/57A4BBD796/ )