Slide 1

Slide 1 text

1 Confidential メルカリ生成AI/LLM 専任チームの取り組み Yuki Ishikawa 2023.06.28 @MS Build Japan

Slide 2

Slide 2 text

2 Confidential  いしかわ   ゆうき 石川 佑樹 株式会社メルカリ 執行役員 VP of Generative AI / LLM 東京大学卒業後、2012年任天堂株式会社入社。2014年にモイ株式会社(ツイ キャス)に入社し、各種開発や新規立ち上げに従事。2017年6月メルカリグループ の株式会社ソウゾウ(旧)に入社。その後、株式会社メルカリへ異動を経て、2020 年7月より株式会社メルペイ執行役員VP of Product。2021年1月から株式会社 ソウゾウ代表取締役CEO。2022年7月から株式会社メルカリ執行役員VPを兼 任。

Slide 3

Slide 3 text

3 Confidential 直近までの取り組み メルカリグループのソウゾウ社を立ち上げ、B2Cの『メルカリShops』をつくっていました

Slide 4

Slide 4 text

4 Confidential 専任チームを作りました

Slide 5

Slide 5 text

5 Confidential 目次 No CONTENTS 1 生成AIの潮流 2 AIの急激な変化への対応 3 具体的な取り組み 4 プロダクトアイデアの事例 5 直近リリース予定の施策紹介 6 最後に

Slide 6

Slide 6 text

6 Confidential 生成AIの潮流

Slide 7

Slide 7 text

7 Confidential “Scaling Laws” for Neural Language Models 言語モデルのパラメーター数(=モデルのサイズ)や、データセットのサイズ、 トレーニングに使用される計算(Compute)量が増えるにつれて、損失 (Loss、誤差)が「べき乗則」に従って減少する 出典:Jared Kaplan et al., "Scaling Laws for Neural Language Models" , arXiv:2001.08361

Slide 8

Slide 8 text

8 Confidential “Emergent” Phenomena in Large Language Models 特定の転換点で、精度が劇的に向上した、という研究もある 出典:Jason Wei et al., "Emergent Abilities of Large Language Models", arXiv:2206.07682

Slide 9

Slide 9 text

9 Confidential GPT3含む、様々なLLMの勃興 直近では、さらにその勢いが加速している 出典:Wayne Xin Zhao et al., "A Survey of Large Language Models", arXiv:2303.18223

Slide 10

Slide 10 text

10 Confidential 現時点でも、色んなジャンルで多数のサービスが登場 出典:KONSTANTINE BUHLER, "Generative AI Is Exploding. These Are The Most Important Trends To Know", APRIL 11, 2023

Slide 11

Slide 11 text

11 Confidential ベーシックな使い方だけでも様々な活用方法 ● Text ○ Marketing ○ Sales ○ Support ○ Knowledge ○ General writing ● Video ○ Video editing / generation ○ Personalized videos ● Image ○ Image generation ○ Consumer / Social ○ Media / Advertising ○ Design ● Code ○ Code generation ○ Documentation ○ Web app builders ○ Text to SQL ● 3D ○ 3D models / scenes ● Speech ○ Voice synthesis ● Others ○ Gaming ○ Music ○ Audio ○ RPA ○ Biology / Chemistry

Slide 12

Slide 12 text

12 Confidential AIの急激な進化への対応

Slide 13

Slide 13 text

13 Confidential 大きな変化に備えて、必要な変革をすべき Direction Investment Execution

Slide 14

Slide 14 text

14 Confidential Direction “AI Driven” ● AI Driven For UX ● AI Driven For Engineering ● AI Driven For Employee Direction

Slide 15

Slide 15 text

15 Confidential Direction: AI Driven For UX ● AIの進化をみた上で、1,3,5年後のメルカリの姿にどうAIが統合されていくと思う か? ● 生成AI/LLM時代の、AIを活かしたプロダクト体験はどんなものであるべきか? AIを活かした お客さまへのプロダクト体験

Slide 16

Slide 16 text

16 Confidential Direction: AI Driven For Engineering ● AI活用をしやすいデータ・API設計はどういうものか?そのために必要なアクショ ンは何か? ● AIによる自動化やパーソナライズのための必要情報は十分reachableになっ ているか?必要な情報量・幅はあるか? AIを活かすための基盤投資

Slide 17

Slide 17 text

17 Confidential Direction: AI Driven For Employee ● 全ての領域・職種で、AIと協働してパフォーマンスを発揮できているか? ● AIの最新の進歩と可能性を継続的に学習し、業務に適用する仕組みを構築でき ているか? AI活用を前提とした 業務設計・組織設計

Slide 18

Slide 18 text

18 Confidential Investment 機動的に動ける専任チームの組成 ● 技術探索 ● 既存プロジェクトへの適応 ● 新規事業の企画・実装 Investment

Slide 19

Slide 19 text

19 Confidential Execution 生成AI/LLM専任チームの ミッション ● 生成AI/LLM技術を用いた、新たなお客さま体験創出と事業インパク トの最大化 ● 全社の生産性の劇的な向上 Execution

Slide 20

Slide 20 text

20 Confidential Execution 具体的な取り組み

Slide 21

Slide 21 text

21 Confidential LLMチームでやっていること Enabling と Building

Slide 22

Slide 22 text

22 Confidential ① ガイドライン策定 ● MLチームだけでなく、一般のSWEのチームもプロダクト実装できるように必要 ● メルカリ研究開発組織「R4D」とも連携しつつ策定 ● 国内外の状況をキャッチアップしつつ、作る。意外と大変。 ② 勉強会・ハッカソン Enabling ● 毎週金曜に社内勉強会やってる(ゆるふわ) ● 全社のハッカソンにうまく乗っかって、布教活動 ● 4月/メルカリJPのハッカソンでLLM Award、6月/メルペイでLLMハッカソン

Slide 23

Slide 23 text

23 Confidential Building(メルカリ社員専用ツール) 社内の利用促進のため、業務情報を入れても良いメルカリ社員専用の”ChatGPT”を作 成。最近、GPT-4とGoogle PaLMにも対応して、徐々に社内OSS的な運用へ移行。

Slide 24

Slide 24 text

24 Confidential Enabling & Building(既存プロダクトへの適応) 各Function Team (チーム名はイメージ ) Seller UX Buyer UX CS Fintech LLM team 企画立案、利用モデルの選定、 prompt engineering、プロダクト実装etc B2C XB

Slide 25

Slide 25 text

25 Confidential Enabling & Building(既存プロダクトへの適応) ② 共創 ① 主導 Functionチームがリード し、LLM周りを必要に 応じて専任チームが確認 するなど並走するケース LLM専任チームが オーナーシップをもち、 企画から実装まで実施す るケース

Slide 26

Slide 26 text

26 Confidential モデルの選定 1. LLM APIs ex: Azure OpenAI Service, OpenAI API, Google PaLM2, Claude etc 2. OSS models ex: Dolly2.0, OpenLLaMa, Falcon, OpenCALM etc 3. 内製の基盤モデル

Slide 27

Slide 27 text

27 Confidential ツールの選定 ● Retrieval Augmented Generation ○ 回答に必要な情報を検索してテキストを生成する ○ ツール:Azure Cognitive Search, Elasticsearch ● Function call ○ 必要なAPIを自分でコールしてアクションを起こす。 Agent作成には必須 ○ ツール:OpenAI Function calling, LangChain ● LLM Pipeline ○ 上記のような拡張をつなげる。複雑な機能開発には必須。 ○ ツール:LangChain, Semantic Kernel

Slide 28

Slide 28 text

28 Confidential プロダクトアイデアの事例

Slide 29

Slide 29 text

29 Confidential プロダクト検討について、直近のハッカソン事例から紹介

Slide 30

Slide 30 text

30 HACK FEST Search + Chat GPT FY2023 Q4 Spring

Slide 31

Slide 31 text

Grand Vision ● Chat that understands what the user wants, and provides what our service can. ● Search the app and data, not just items ● “I want to buy Pixel 7” -> Display Pixel 7 listings ● “I want to list my iPhone 13” -> List with pre-filled information ● “How much did I earn in Mercari?” -> “You earned XX yen total.”

Slide 32

Slide 32 text

Demo time! @allan.conda Recording

Slide 33

Slide 33 text

Technical Details

Slide 34

Slide 34 text

Implementation Plan 1. Provide GPT a list of Mercari APIs and deeplinks as context, with a simple description 2. GPT should be able to give instructions to call the correct API or deeplinks to satisfy the request. 3. Chat: Send the APIs response to GPT to find the information 4. Present GPT’s final response as Chat to user.

Slide 35

Slide 35 text

Initial Prompt for Search '''''' Possible deeplinks in the app: Item Detail Screen xxxxx://xxxx/xxxxxxxx?id={item_id} Listing Screen xxxxx://xxxxx/xxxxxx Search Results Screen mercari://xxxxx/xxxxxxx?param={param} xxxxx://xxxx Bought Items /xxxxxxxx Coupon List /xxxxxxx Draft Listings /xxxxx … '''''' Display the deeplink first, followed by a newline, then a human readable action label {deeplink} {button action label} ''''''

Slide 36

Slide 36 text

Initial Prompt for Chat '''’'' Mercari API: Description: {endpoint_path} [{query_name: Type}] Liked Items History: xxx/xxxxx [xxxxx: Int] My User Profile: xxxxx/xxxxx?_user_format="xxxx" '''''' If it is plain user prompt, create only API call instruction tokens in order to retrieve the information by the Mercari user. Strict completion format for tokenization. Do not return anything else but the instruction in this case. example format: GET: xxx/xxxx?pageSize=10 If the prompt is json response data, consider it as the success response of the API call and use it to retrieve the data desired by the user and describe to the user. ''''''

Slide 37

Slide 37 text

Mercari comment assistant powered by ChatGPT kenmaz @merpay iOS team

Slide 38

Slide 38 text

My LINE message log I don’t like typing long sentences on iPhone

Slide 39

Slide 39 text

As-Is この度はご購入ありがとうございます。本日中 に発送致しますので、今しばらくお待ちくださ くぁwせdrftgyふじこlp

Slide 40

Slide 40 text

To-Be おけ

Slide 41

Slide 41 text

To-Be / Powered by Chat GPT この度はご購入ありがとうございます。本日中 に発送致しますので、今しばらくお待ちくださ いませ。 お け

Slide 42

Slide 42 text

DEMO

Slide 43

Slide 43 text

No content

Slide 44

Slide 44 text

No content

Slide 45

Slide 45 text

Overall Design - API Key - Comments - User input https://api.openai.com/v1/chat/completions - User input (Polite version)

Slide 46

Slide 46 text

Prompt Engineering [ "role": "system" "content":”C2Cマーケットプレイスアプリにおいて、出品者と購入者がコメントのやり取りを行なっています。  [これまでのコメントのやり取り ]の内容を踏まえて、[回答]を丁寧な日本語に置き換えてください。例を示します # Input [これまでのコメントのやり取り ] 値下げしてください [回答] むり #Output 申し訳ありませんが、値下げの交渉はお断りしております。 ], [ "role": "user", "content": “ [これまでのコメントのやり取り ] こんにちは!値下げしていただくことは可能でしょうか!? [回答] いやだ ] Context and Rule Definition Actual Input

Slide 47

Slide 47 text

Need improvement - Random Text Quality NG Examples

Slide 48

Slide 48 text

48 Confidential 直近リリース予定の施策を一部紹介

Slide 49

Slide 49 text

49 Confidential 開発中の機能:SEO改善 SEOに関わるメルカリ検索画面のタイトルをLLMでいい感じに生成 検索結果のタイトル ● 「日傘」と「傘」でキー ワードが重複 ● ブランド名の表記 カテゴリ X ブランド名を LLMでいい感じに タイトル生成

Slide 50

Slide 50 text

50 Confidential 開発中の機能:商品情報サジェスト 商品に不足している情報や、売れやすい商品に共通する情報をAIが提案。ルールベー スの実装をLLMで推定に変更。 例: ● 購入時の価格 ● ブランド名やキーワード

Slide 51

Slide 51 text

51 Confidential 最後に

Slide 52

Slide 52 text

52 Confidential We are Hiring! ● Software Engineer(Full Stack) LLM/AI - Mercari ● Senior Product Manager, LLM/GenAI - Mercari メルカリグループのデータや基盤を使ってどんどんサービスを作りたい人募集!

Slide 53

Slide 53 text

53 Confidential イベントの案内(2023年7月20日 10:00 start)

Slide 54

Slide 54 text

54 Confidential All Japan 日本チャンス あらためて、 どんどん やっていきましょう