Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWSでLLMアプリをつくろう / LLM App on AWS
Search
吉田真吾
July 25, 2023
Technology
0
480
AWSでLLMアプリをつくろう / LLM App on AWS
2023.7.24 JAWS-UG東京で話した資料です。
吉田真吾
July 25, 2023
Tweet
Share
More Decks by 吉田真吾
See All by 吉田真吾
OCI Generative AI Serviceの話/20240222
yoshidashingo
0
80
ChatGPTでちゃんと成果を出していく/20240215
yoshidashingo
1
1.7k
この先を生き残るために!!「生存戦略としてのLLMアプリ開発技術」/20240124_PE-BANK
yoshidashingo
0
52
LangChainとフルサーバーレスですばやくセキュアなRAGアプリをつくるための実践解説/LangChain_Book
yoshidashingo
8
3.8k
生成AIで本番アプリをリリースするためのAWS, LangChain, ベクターデータベース実践入門 / LangChain-Bedrock
yoshidashingo
1
870
LLM App with Momento
yoshidashingo
0
180
Azure OpenAIをもちいたLLMアプリの企画から本番構築までの道のり/Microsoft Build Japan
yoshidashingo
8
8.5k
RAGアプリにおけるプロンプトとtemperatureの応答品質への影響ほんとのところ/the real case about temperature and template language
yoshidashingo
0
720
Momento Meetup 2
yoshidashingo
0
110
Other Decks in Technology
See All in Technology
一生覚えておきたい「システム開発=コミュニケーション」〜初めての実務案件振り返りLT〜
maimyyym
2
240
JSON攻略法.pdf
miyakemito
8
5.2k
【SORACOM UG 東海】あらゆるモノがつながる社会へ、IoT と SORACOM
soracom
PRO
1
120
データベース02: データベースの概念
trycycle
0
170
生産性向上チームの紹介
cybozuinsideout
PRO
1
900
実例で紹介するRAG導入時の知見と精度向上の勘所
yamahiro
1
290
Building Dashboards as a Hobby
egmc
0
330
開発生産性大幅アップ!Postman VS Code拡張機能
nagix
3
550
非同期推論システムによるコスト削減と信頼性向上
koki_nishihara
0
310
サーバー間 GraphQL と webmock-graphql の話 / server-to-server graphql and webmock-graphql
qsona
3
200
競技としてのKaggle、役に立つKaggle
yu4u
6
2.2k
チームでロジカルシンキングに改めて向き合っている話 〜学習環境と実践⽅法〜
sansantech
PRO
3
3.2k
Featured
See All Featured
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
155
14k
Building Your Own Lightsaber
phodgson
100
5.7k
How to train your dragon (web standard)
notwaldorf
74
5.2k
Web Components: a chance to create the future
zenorocha
306
41k
Easily Structure & Communicate Ideas using Wireframe
afnizarnur
188
16k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
jQuery: Nuts, Bolts and Bling
dougneiner
59
7.1k
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
501
140k
Navigating Team Friction
lara
179
13k
Web development in the modern age
philhawksworth
203
10k
Clear Off the Table
cherdarchuk
85
310k
Teambox: Starting and Learning
jrom
128
8.4k
Transcript
"84Ͱ࣮ݱ͢Δ --.ϫʔΫϑϩʔ Ծ JAWS-UG / !ZPTIJEBTIJOHP
吉田真吾 AWS Serverless Hero n p Oracle SA p 113
/ pAWS n ( ) CTO p SaaS ( ) pAWS DevOps n pAWS (2012 ) pAWS Samurai 2014 / 2016 pAWS Serverless Hero AWS AWS Lambda Amazon S3 BRAv6
IUUQTUPLZPTFSWFSMFTTEBZTJP ˣ l(FU5JDLFUTz ˣ 𝕏 l4FSWFSMFTT%BZT 5PLZPʹࢀՃΛਃ͠ࠐΈ·ͨ͠ʂz
None
3"( ݕࡧ֦ுੜ ΞϓϦ ʮ$:%"41&01-&ʯʹɺࣾһ͔Βͷ͍߹ΘͤʹࣗಈͰ͑Δ$IBU(15ػೳʮ$:%"41&01-&$PQJMPU$IBUʯ https://www.cydas.co.jp/news/press/202304_people-gpt/
None
ੈେ--.࣌ "*ͷຽओԽ ΞϓϦ։ൃऀ͕--.ΞϓϦΛϢʔβʔʹಧ͚͍࣌͢ ͬͱখ͍͠Μ͔ͱࢥͬͯͨΑ
λεΫ ❌ ˠ ۀ ⭕ ϫʔΫϑϩʔ ෳͷλεΫΛϓϩάϥϛϯάʹΑΔ੍ޚͱɺ--.ʹΑΔ੍ޚΛͭͳ͍Ͱ ࣮ݱ͢Δ
ֶΜͩ͜ͱ 3"(࣮͍͢͠ˠ<69؍>ैདྷͷݕࡧ6* --.Tͳ͠ ͰղܾͰ͖Δʁ ຒΊࠐΈදݱ &NCFEEJOHT औಘͯ͠ϕΫλʔྨࣅݕࡧ͢ΔΑΓɺΤϯλʔϓ ϥΠζݕࡧͷ΄͏͕͍͍ͨͯɺͯ͢ʹ͓͍ͯྑ͍
--.ͷೳྗΛ׆͔͢ϫʔΫϑϩʔ͕ॏཁ ग़ྗ͕֬ఆతͳϓϩάϥϛϯάͱɺඇ֬ఆతͳ--.ͷΈ߹Θͤ ෳͷλεΫΛνΣΠϯ͍ͯ͘͠🦜🔗 🦜🔗ΞΠσΞʴ࣮ͷๅݿ 3F"DU ˠ MBOHDIBJOBHFOUT )Z%& ˠ ࣭ͷ͑Λ--.͕ໝͯ͠ɺͦͷ͑ʹྨࣅͨࣝ͠ΛݕࡧGSPN MBOHDIBJODIBJOT JNQPSU)ZQPUIFUJDBM%PDVNFOU&NCFEEFS --.0QT㱠.-0QT ೖྗͷมԽ ग़ྗͷมԽʹؾ͖ͮͮΒ͍ ؾ͍ͮͨͱͯͰ͖Δ͜ͱ͕ݶΒΕΔ "1*Ϟσϧͷࠩ͠ସ͑ɺϓϩϯϓτͷௐ ʴ όʔδϣϯཧ ϨεϙϯελΠϜͳͲऔಘ͓͖ͯͩ͘͠Ζ͏ FY -BOH4NJUI
"NB[PO,FOESB 🦜🔗 ⾼精度な⽣成系 AI アプリケーションを Amazon Kendra、LangChain、⼤規模⾔語モデルを使って作る https://aws.amazon.com/jp/blogs/news/quickly-build-high-accuracy-generative-ai-applications-on-enterprise- data-using-amazon-kendra-langchain-and-large-language-models/
🦜🔗 ֶͿͳΒ 6EFNZ -BOH$IBJOʹΑΔେنݴޠϞσϧʢ--.ʣΞϓϦ έʔγϣϯ։ൃೖʕ(15ΛͬͨνϟοτϘοτͷ࣮·Ͱ https://www.udemy.com/course/langchain-apps/
🦜🔗 ֶͿͳΒ ͘͘-BOH$IBJO https://langchain-jp.connpass.com/event/289590/
ηΩϡϦςΟͱϓϥΠόγʔ ຊ൪ڥར༻ʹ͚ͯ
"84ͷΫϥυηΩϡϦςΟσʔλอޢ • ࣄ࣮ • "84ηΩϡϦςΟʹലେͳࢿɿෳͷαʔϏεɺෳͷίϯϓϥ ΠΞϯε४ڌ • ΫϥυΛΫϥυͨΒ͠ΊͯΔͷ "*ʹΑΔίϯτϩʔϧ •
༧ଌ • <>ηΩϡϦςΟ৫ͷ͋ΒΏΔ׆ಈʹෆՄܽʹͳΔ • <>"*ػցֶशͰଅਐ͞ΕͨΦʔτϝʔγϣϯ͕ηΩϡϦςΟΛڧ Խ͢Δ • "NB[PO(VBSE%VUZɺ"NB[PO%FUFDUJWFɺ"NB[PO$PEF(VSVɺ"NB[PO .BDJFʜ • <>σʔλอޢͷΑΓେ͖ͳࢿ͕ਐΉ • (%13ಉ༷ͷن੍ͷੈք֤ࠃͷ͕Γɾ࣮ӡ༻ͷڧԽ CJ Moses による 2023 年以降の セキュリティに 関する予測 https://d1.awsstatic.com/Security/Security_Predictions_e-book_2022_JP .pdf
08"415PQ--.ΞϓϦ<ESBGU> ϓϩϯϓτΠϯδΣΫγϣϯ • --.͕ҙਤ͠ͳ͍ಈ࡞ΛҾ͖ى͜͢ϓϩϯϓτͷ ্ॻ͖ ҆શͰͳ͍ग़ྗॲཧ • όοΫΤϯυγεςϜͷใ͕ग़ྗ͞ΕΔ͜ͱʹ
ΑΔѱ༻ τϨʔχϯάσʔλͷԚછ • ηΩϡϦςΟɺ༗ޮੑɺྙཧత;Δ·͍ͷӨڹ Ϟσϧͷ%P4 • େྔͷτʔΫϯফඅɺϨεϙϯεѱԽɺίετߴ ಅ αϓϥΠνΣʔϯͷ੬ऑੑ • ϓϥάΠϯSEύʔςΟͷίϯϙʔωϯτ͔Β ͷ৵ ػີσʔλͷ࿙Ӯ • ԠͰػີσʔλΛ࿙Ӯ͢ΔՄೳੑˠෆਖ਼ΞΫηεɺ ϓϥΠόγʔ৵ɺηΩϡϦςΟ৵ ҆શͰͳ͍ϓϥάΠϯઃܭ ˞ͱྨࣅ • ϓϥάΠϯ͔Β҆શͰͳ͍ೖྗʹΑΓ੬ऑੑ͕ѱ༻ ͞ΕΔ ΤʔδΣϯτͷ • ࣗతͳΤʔδΣϯτ͕ҙਤ͠ͳ͍݁ՌΛͨΒ͢ ΞΫγϣϯΛ࣮ߦ͢ΔՄೳੑ աͳґଘ • ෆਖ਼֬ɾෆదͳੜίϯςϯπʹґଘͯ͠σϚɺ ๏తɺηΩϡϦςΟ੬ऑੑʹ໘͢Δ Ϟσϧట • ಠࣗϞσϧͷෆਖ਼ΞΫηεɺྲྀग़ˠܦࡁଛࣦɺڝ ૪༏ҐੑԼ ˞ৠཹϑΝΠϯνϡʔχϯάάϨʔ͔ OWASP Top 10 for Large Language Model Applications https://owasp.org/www-project-top-10-for-large-language-model-applications/
ݸਓσʔλอޢ๏੍ɿνΣοΫ͖͢ • ԿΛอޢ͢Δͷ͔ˠʮݸਓͷݖརརӹʯ • ݸਓσʔλอޢͷʮܾఆࢦʯརӹϞσϧ • ࣗݾใίϯτϩʔϧݖͰͳ͘ɺใతଞ͔Βͷࣗ༝ • ΘΕΘΕʹԿ͕ٻΊΒΕ͏Δͷ͔ •
ࣗݾใίϯτϩʔϧݖࡒ࢈ݖతϞσϧͷຊਓಉҙݪଇ ΦϓτΠϯΦϓτΞτ ˠͳʹ͕ ݸਓใͰͳʹ͕ݸਓใͰͳ͍ͱ͍͏ٞʹͳΔ • ใతଞݸਓσʔλॲཧʹجͮ͘ଞऀʹΑΔධՁɾܾఆ͕ຊਓͷࣗݾܾఆΛ્͠͏Δ͜ ͱˠ͔Βͷࣗ༝ ޚͰ͖Δ͜ͱ • ͨͱ͑ • ݹ͍ଐੑใɺ͍͋·͍ͳଐੑใͰ৬ͰͷධՁ͕ܾΊΒΕͨ ˞ͦͦ0&$%ݪଇ σʔλ࣭ͷݪଇ ʹ͍ͯ͠Δ͕ɻ • ؔ࿈ੑͷͳ͍ใͰෆརͳΫϨδοτείΞ͕ܾఆ͞Εͨ ˠ ͜ΕΒΛγεςϜͰϞχλϦϯά͢Δෆஅͷྗ͕ٻΊΒΕ͏Δ • ཧతجૅ͔Β๏ମܥͷཧ • ౷੍͞Εͨඇબผར༻ˠҩྍԾ໊Ճใɿ౷ܭྔʹूܭͨ͠σʔλɺ·ͨೋ࣍ར༻ • ݸਓσʔλॲཧத৺ͷنˠॲཧରͱ͠ͳ͍σʔλͷϚεΩϯάɺΦϓτΠϯॲཧͷෛ୲ • ධՁɾܾఆͷదੑ֬อˠબผΞϧΰϦζϜ దੑͰબผͨ͠ڭҭϓϩάϥϜɺ0,ʁ 【提⾔書公表】デジタル社会を駆動する『個⼈データ保護法制』に向けて(GLOCOM六本⽊会議) https://www.glocom.ac.jp/news/news/8540
🦜🔗 &YQFSJNFOUBMύοέʔδׂ • Ϗοάχϡʔε • $7& ੬ऑੑ ΛؚΉػೳΛͯ͢ผύοέʔδ &YQFSJNFOUBM ʹ
• 🦜🔗ίΞͷεϦϜԽ • $PNNVOJUZνΣΠϯͱ͍͏ύοέʔδͷܭըʹݴٴ • ҙຯ͢Δ͜ͱ • ຊ൪Ͱ͑ͳ͍ ˠ ͍͏Δ • ͜ͷऑɺແ੍ݶʹ֦ு͞ΕΔҰํͩͬͨͷͰ-BNCEB-BZFSʹ͍ ͔ͭΒͳ͘ͳΔ ˠ Ұఆͷަ௨ཧ͕͞ΕΔΑ͏ʹͳΔ • จͷ࣮৺తͳΞΠσΞͷ࣮͕ΑΓ13ग़͘͢͠ͳΔ • "84-BNCEBͰͷར༻ • ݱࡏͷαΠζɿґଘϥΠϒϥϦؚΊͨల։ޙαΠζͰ.#ఔ • εϐϯΞοϓʹ͓͓ΉͶඵఔ͔͔Δˠ4MBDL͔Β͏߹ -B[ZϦεφʔϦτϥΠϔομͷνΣοΫͳͲෳͷରࡦ͕ඞཁ
IUUQTUPLZPTFSWFSMFTTEBZTJP ˣ l(FU5JDLFUTz ˣ 𝕏 l4FSWFSMFTT%BZT 5PLZPʹࢀՃΛਃ͠ࠐΈ·ͨ͠ʂz
%":4্࢙࠷ߴͷϥΠϯφοϓ • ߽՚ηογϣϯ • Ωʔϊʔτɿ"84 • αʔόʔϨεͷख़ •
αʔόʔαΠυओମ͔ΒΤοδϑϩϯτͷ։ൃϥΠϑαΠΫϧ ͷมԽ • ੜ"*ͱαʔόʔϨε • ߽՚εϙϯαʔ • "84 • .PNFOUP • 1JOH$"1 5J%# • .JDSPTPGU • ,%%*ΞδϟΠϧ։ൃηϯλʔ • 4FSWFSMFTT0QFSBUJPOT