Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ChatGPT活用サービスの
スケール時の落とし穴と対策 - 生成AIにおけるpiconのこれまでのチャレンジと今後 -

Shibuya Yukito
July 05, 2023
140

ChatGPT活用サービスの
スケール時の落とし穴と対策 - 生成AIにおけるpiconのこれまでのチャレンジと今後 -

Shibuya Yukito

July 05, 2023
Tweet

Transcript

  1. 3/2 • ىচ: ChatGPT APIͷϦϦʔεϝʔϧ͕ಧ͍ͯΔ • ޕલத: ݩʑ͋ͬͨΞϓϦͷΞϓσ࡞ۀʢ࣭ͱ଎౓Ͱֵ໋Λײ͡Δʣ • ޕޙ:

    ࣗ෼ͰɺεϚϗͰ࢖͏ͳΒLINEͩͳͱࢥ͍ϓϩτλΠϓ࡞Δ • ༦ํ: ୅දͷshosemaruʹϦϦʔε͍͍͔ͯ͠ฉ͘ -> OK͕ग़Δ • ໷: ʮAIνϟοτ͘ΜʯͷϦϦʔεπΠʔτ ίʔυͷ8ׂ͙Β͍͸ChatGPTʹॻ͍ͯ΋Βͬͨ ։ൃ·ͰͷܦҢ
  2. • Server: Cloud Functionsʢnode.jsʣ • DB: Firestore • ࢖͍ͬͯΔAPI: ChatGPT

    / LINE API ౰ॳͷߏ੒ Φʔτεέʔϧ / αʔόʔϨεͰ؆୯ϥΫϥΫʢͱࢥ͍ͬͯͨʣ
  3. • 7/4࣌఺ ొ࿥ऀ਺12ສ௒͑ • ࣗલPC΍ϞσϧͷηοτΞοϓෆཁ • ೔ຊޠରԠ • image 2

    imageʹ΋ରԠ AIΠϥετ͘Μͷಛ௃ ೔ຊޠରԠʂLINEͰStable Di ff usionΛ࢖͑ΔαʔϏε
  4. • piconͰ͸… • 2/4ʹAIνϟοτ͘Μͷલ਎ͰGPT-3ΛνϟοτܗࣜͰ࢖͑ΔΞϓϦ ʢFlutterʣΛϦϦʔεࡁΈͩͬͨ • ͦͷͨΊɺૣΊʹ໰୊ʹͿͪ౰ͨΓɺগ࣮ͣͭ͠੷Λ࡞Εͨ • Tips •

    Quotaͷਃ੥͸ɺଟ͗͢Δ͔ΒϦδΣΫτͬͯ͜ͱ͸ͳ͍ͷͰଟΊ ͰOK • ਃ੥͔Βঝೝ·Ͱ͸਺೔͙Β͍ ରࡦ: ૣΊʹૣΊʹҾ্͖͛ਃ੥͢Δ ໰୊1: usage limitͷॳظ஋͕খ͗͢͞Δ…
  5. ରࡦ: ໰୊3: RateLimitͲ͏͠Α͏΋ͳ͍… OpenAI Azure OpenAI MAXϦΫΤετ/min 3,500 300
 →

    ഇࢭʹͳͬͨʁ MAXτʔΫϯ਺/min 90,000 120,000
 200,000 500τʔΫϯ/req ͷͱ͖ͷmaxϦΫΤετ/min 180 240
 400
  6. ରࡦ: ΠϯελϯεΛෳ਺ཱͯͯෛՙ෼ࢄ ໰୊3: RateLimitͲ͏͠Α͏΋ͳ͍… • RateLimitͷҾ্͖͛͸ɺAzure΋OpenAI΋΄΅ແཧͬΆ͍ • Azure OpenAIͩͱɺϦʔδϣϯ͝ͱʹ2ΠϯελϯεཱͯΒΕΔ •

    OpenAIͱAzure OpenAIͷซ༻΋͋Γ • ΠϯελϯεΛෳ਺ཱͯͯɺϦΫΤετΛ෼ࢄͤ͞Δ͜ͱͰճආ͢Δ ͔͠ͳ͍ • ࢀߟ: Azure OpenAI Service΁ͷෛՙ෼ࢄ • https://logico-jp.io/2023/06/08/request-load-balancing-for-azure- openai-service/
  7. • ʮAIνϟοτ͘Μ͸ແྉͰ͔͢ʁʯͱ͔ΊͬͪΌฉ͘ • ͔͠͠ɺద౰ͳ౴͕͑ฦ͖ͬͯͯ͠·͏ -> UXతʹ࠷ѱ • ར༻ن໿ / ϓϥΠόγʔϙϦγʔ

    / ղ໿ಋઢͳͲ… ରࡦ: ༧໿ޠΛ࡞ͬͯɺఆܕจΛฦ͢Α͏ʹ͢Δ ͦͷଞ: ࣗ෼ࣗ਎ͷ৘ใΛ஌Βͳ͍໰୊
  8. • ܦӦϝϯόʔͷ1ਓͯ͠ࣄۀܭըʹଇΓɺϓϩμΫτϩʔυϚοϓͷࡦఆͱ։ൃͷϚωδϝϯτ • ෳ਺ϓϩμΫτʹ͓͚Δऩӹੑͷ޲্ • ։ൃνʔϜͷϚωδϝϯτʢ࠾༻/ҭ੒ʣ CPOީิ: ϏδϣϯΛϓϩμΫτʹམͱ͠ࠐΈɺऩӹԽ·Ͱ͍͚࣋ͬͯΔํ ੜ੒AIͷະདྷΛҰॹʹͭ͘ΔਓɺେืूதͰ͢ɻ CTOީิ:

    ࣾ಺֎ͷνʔϜͱͱ΋ʹpiconΛٕज़ͰϦʔυͯ͘͠ΕΔํ • ܦӦϝϯόʔͷ1ਓͯ͠։ൃνʔϜͷ૊੒ • ٕज़ઓུͷࡦఆͱ࣮ߦ • ֎෦ύʔτφʔͷϚωδϝϯτ C޲͚ͷྖҬͰɺϢʔβʔʹ޲͖߹ͬͨ։ൃΛ͢ΔจԽͰ͢ɻ