Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWSでLLMアプリをつくろう / LLM App on AWS
Search
吉田真吾
July 25, 2023
Technology
0
590
AWSでLLMアプリをつくろう / LLM App on AWS
2023.7.24 JAWS-UG東京で話した資料です。
吉田真吾
July 25, 2023
Tweet
Share
More Decks by 吉田真吾
See All by 吉田真吾
AWS Lambdaと歩んだ“サーバーレス”と今後 #lambda_10years
yoshidashingo
1
170
AOAI Dev Day - Opening Session
yoshidashingo
2
1.5k
LLMアプリにエージェントらしさを組み込む/Build LLM Apps Agentically
yoshidashingo
6
1.3k
マルチエージェントで性能が上がったText-to-SQLのいま/Text-to-SQL
yoshidashingo
2
2.4k
AIエージェントをちゃんと作る/How to build agentic AI
yoshidashingo
5
870
OCI Generative AI Serviceの話/20240222
yoshidashingo
0
110
ChatGPTでちゃんと成果を出していく/20240215
yoshidashingo
3
5.6k
この先を生き残るために!!「生存戦略としてのLLMアプリ開発技術」/20240124_PE-BANK
yoshidashingo
0
110
LangChainとフルサーバーレスですばやくセキュアなRAGアプリをつくるための実践解説/LangChain_Book
yoshidashingo
8
4.1k
Other Decks in Technology
See All in Technology
AWS Media Services 最新サービスアップデート 2024
eijikominami
0
200
Amazon Personalizeのレコメンドシステム構築、実際何するの?〜大体10分で具体的なイメージをつかむ〜
kniino
1
100
なぜ今 AI Agent なのか _近藤憲児
kenjikondobai
4
1.4k
VideoMamba: State Space Model for Efficient Video Understanding
chou500
0
190
適材適所の技術選定 〜GraphQL・REST API・tRPC〜 / Optimal Technology Selection
kakehashi
1
170
Adopting Jetpack Compose in Your Existing Project - GDG DevFest Bangkok 2024
akexorcist
0
110
Lexical Analysis
shigashiyama
1
150
Platform Engineering for Software Developers and Architects
syntasso
1
520
Making your applications cross-environment - OSCG 2024 NA
salaboy
0
180
ドメイン名の終活について - JPAAWG 7th -
mikit
33
20k
隣接領域をBeyondするFinatextのエンジニア組織設計 / beyond-engineering-areas
stajima
1
270
Exadata Database Service on Dedicated Infrastructure(ExaDB-D) UI スクリーン・キャプチャ集
oracle4engineer
PRO
2
3.2k
Featured
See All Featured
Automating Front-end Workflow
addyosmani
1366
200k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
How To Stay Up To Date on Web Technology
chriscoyier
788
250k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
131
33k
The Art of Programming - Codeland 2020
erikaheidi
52
13k
It's Worth the Effort
3n
183
27k
RailsConf 2023
tenderlove
29
900
Reflections from 52 weeks, 52 projects
jeffersonlam
346
20k
Why Our Code Smells
bkeepers
PRO
334
57k
Mobile First: as difficult as doing things right
swwweet
222
8.9k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.3k
Measuring & Analyzing Core Web Vitals
bluesmoon
4
120
Transcript
"84Ͱ࣮ݱ͢Δ --.ϫʔΫϑϩʔ Ծ JAWS-UG / !ZPTIJEBTIJOHP
吉田真吾 AWS Serverless Hero n p Oracle SA p 113
/ pAWS n ( ) CTO p SaaS ( ) pAWS DevOps n pAWS (2012 ) pAWS Samurai 2014 / 2016 pAWS Serverless Hero AWS AWS Lambda Amazon S3 BRAv6
IUUQTUPLZPTFSWFSMFTTEBZTJP ˣ l(FU5JDLFUTz ˣ 𝕏 l4FSWFSMFTT%BZT 5PLZPʹࢀՃΛਃ͠ࠐΈ·ͨ͠ʂz
None
3"( ݕࡧ֦ுੜ ΞϓϦ ʮ$:%"41&01-&ʯʹɺࣾһ͔Βͷ͍߹ΘͤʹࣗಈͰ͑Δ$IBU(15ػೳʮ$:%"41&01-&$PQJMPU$IBUʯ https://www.cydas.co.jp/news/press/202304_people-gpt/
None
ੈେ--.࣌ "*ͷຽओԽ ΞϓϦ։ൃऀ͕--.ΞϓϦΛϢʔβʔʹಧ͚͍࣌͢ ͬͱখ͍͠Μ͔ͱࢥͬͯͨΑ
λεΫ ❌ ˠ ۀ ⭕ ϫʔΫϑϩʔ ෳͷλεΫΛϓϩάϥϛϯάʹΑΔ੍ޚͱɺ--.ʹΑΔ੍ޚΛͭͳ͍Ͱ ࣮ݱ͢Δ
ֶΜͩ͜ͱ 3"(࣮͍͢͠ˠ<69؍>ैདྷͷݕࡧ6* --.Tͳ͠ ͰղܾͰ͖Δʁ ຒΊࠐΈදݱ &NCFEEJOHT औಘͯ͠ϕΫλʔྨࣅݕࡧ͢ΔΑΓɺΤϯλʔϓ ϥΠζݕࡧͷ΄͏͕͍͍ͨͯɺͯ͢ʹ͓͍ͯྑ͍
--.ͷೳྗΛ׆͔͢ϫʔΫϑϩʔ͕ॏཁ ग़ྗ͕֬ఆతͳϓϩάϥϛϯάͱɺඇ֬ఆతͳ--.ͷΈ߹Θͤ ෳͷλεΫΛνΣΠϯ͍ͯ͘͠🦜🔗 🦜🔗ΞΠσΞʴ࣮ͷๅݿ 3F"DU ˠ MBOHDIBJOBHFOUT )Z%& ˠ ࣭ͷ͑Λ--.͕ໝͯ͠ɺͦͷ͑ʹྨࣅͨࣝ͠ΛݕࡧGSPN MBOHDIBJODIBJOT JNQPSU)ZQPUIFUJDBM%PDVNFOU&NCFEEFS --.0QT㱠.-0QT ೖྗͷมԽ ग़ྗͷมԽʹؾ͖ͮͮΒ͍ ؾ͍ͮͨͱͯͰ͖Δ͜ͱ͕ݶΒΕΔ "1*Ϟσϧͷࠩ͠ସ͑ɺϓϩϯϓτͷௐ ʴ όʔδϣϯཧ ϨεϙϯελΠϜͳͲऔಘ͓͖ͯͩ͘͠Ζ͏ FY -BOH4NJUI
"NB[PO,FOESB 🦜🔗 ⾼精度な⽣成系 AI アプリケーションを Amazon Kendra、LangChain、⼤規模⾔語モデルを使って作る https://aws.amazon.com/jp/blogs/news/quickly-build-high-accuracy-generative-ai-applications-on-enterprise- data-using-amazon-kendra-langchain-and-large-language-models/
🦜🔗 ֶͿͳΒ 6EFNZ -BOH$IBJOʹΑΔେنݴޠϞσϧʢ--.ʣΞϓϦ έʔγϣϯ։ൃೖʕ(15ΛͬͨνϟοτϘοτͷ࣮·Ͱ https://www.udemy.com/course/langchain-apps/
🦜🔗 ֶͿͳΒ ͘͘-BOH$IBJO https://langchain-jp.connpass.com/event/289590/
ηΩϡϦςΟͱϓϥΠόγʔ ຊ൪ڥར༻ʹ͚ͯ
"84ͷΫϥυηΩϡϦςΟσʔλอޢ • ࣄ࣮ • "84ηΩϡϦςΟʹലେͳࢿɿෳͷαʔϏεɺෳͷίϯϓϥ ΠΞϯε४ڌ • ΫϥυΛΫϥυͨΒ͠ΊͯΔͷ "*ʹΑΔίϯτϩʔϧ •
༧ଌ • <>ηΩϡϦςΟ৫ͷ͋ΒΏΔ׆ಈʹෆՄܽʹͳΔ • <>"*ػցֶशͰଅਐ͞ΕͨΦʔτϝʔγϣϯ͕ηΩϡϦςΟΛڧ Խ͢Δ • "NB[PO(VBSE%VUZɺ"NB[PO%FUFDUJWFɺ"NB[PO$PEF(VSVɺ"NB[PO .BDJFʜ • <>σʔλอޢͷΑΓେ͖ͳࢿ͕ਐΉ • (%13ಉ༷ͷن੍ͷੈք֤ࠃͷ͕Γɾ࣮ӡ༻ͷڧԽ CJ Moses による 2023 年以降の セキュリティに 関する予測 https://d1.awsstatic.com/Security/Security_Predictions_e-book_2022_JP .pdf
08"415PQ--.ΞϓϦ<ESBGU> ϓϩϯϓτΠϯδΣΫγϣϯ • --.͕ҙਤ͠ͳ͍ಈ࡞ΛҾ͖ى͜͢ϓϩϯϓτͷ ্ॻ͖ ҆શͰͳ͍ग़ྗॲཧ • όοΫΤϯυγεςϜͷใ͕ग़ྗ͞ΕΔ͜ͱʹ
ΑΔѱ༻ τϨʔχϯάσʔλͷԚછ • ηΩϡϦςΟɺ༗ޮੑɺྙཧత;Δ·͍ͷӨڹ Ϟσϧͷ%P4 • େྔͷτʔΫϯফඅɺϨεϙϯεѱԽɺίετߴ ಅ αϓϥΠνΣʔϯͷ੬ऑੑ • ϓϥάΠϯSEύʔςΟͷίϯϙʔωϯτ͔Β ͷ৵ ػີσʔλͷ࿙Ӯ • ԠͰػີσʔλΛ࿙Ӯ͢ΔՄೳੑˠෆਖ਼ΞΫηεɺ ϓϥΠόγʔ৵ɺηΩϡϦςΟ৵ ҆શͰͳ͍ϓϥάΠϯઃܭ ˞ͱྨࣅ • ϓϥάΠϯ͔Β҆શͰͳ͍ೖྗʹΑΓ੬ऑੑ͕ѱ༻ ͞ΕΔ ΤʔδΣϯτͷ • ࣗతͳΤʔδΣϯτ͕ҙਤ͠ͳ͍݁ՌΛͨΒ͢ ΞΫγϣϯΛ࣮ߦ͢ΔՄೳੑ աͳґଘ • ෆਖ਼֬ɾෆదͳੜίϯςϯπʹґଘͯ͠σϚɺ ๏తɺηΩϡϦςΟ੬ऑੑʹ໘͢Δ Ϟσϧట • ಠࣗϞσϧͷෆਖ਼ΞΫηεɺྲྀग़ˠܦࡁଛࣦɺڝ ૪༏ҐੑԼ ˞ৠཹϑΝΠϯνϡʔχϯάάϨʔ͔ OWASP Top 10 for Large Language Model Applications https://owasp.org/www-project-top-10-for-large-language-model-applications/
ݸਓσʔλอޢ๏੍ɿνΣοΫ͖͢ • ԿΛอޢ͢Δͷ͔ˠʮݸਓͷݖརརӹʯ • ݸਓσʔλอޢͷʮܾఆࢦʯརӹϞσϧ • ࣗݾใίϯτϩʔϧݖͰͳ͘ɺใతଞ͔Βͷࣗ༝ • ΘΕΘΕʹԿ͕ٻΊΒΕ͏Δͷ͔ •
ࣗݾใίϯτϩʔϧݖࡒ࢈ݖతϞσϧͷຊਓಉҙݪଇ ΦϓτΠϯΦϓτΞτ ˠͳʹ͕ ݸਓใͰͳʹ͕ݸਓใͰͳ͍ͱ͍͏ٞʹͳΔ • ใతଞݸਓσʔλॲཧʹجͮ͘ଞऀʹΑΔධՁɾܾఆ͕ຊਓͷࣗݾܾఆΛ્͠͏Δ͜ ͱˠ͔Βͷࣗ༝ ޚͰ͖Δ͜ͱ • ͨͱ͑ • ݹ͍ଐੑใɺ͍͋·͍ͳଐੑใͰ৬ͰͷධՁ͕ܾΊΒΕͨ ˞ͦͦ0&$%ݪଇ σʔλ࣭ͷݪଇ ʹ͍ͯ͠Δ͕ɻ • ؔ࿈ੑͷͳ͍ใͰෆརͳΫϨδοτείΞ͕ܾఆ͞Εͨ ˠ ͜ΕΒΛγεςϜͰϞχλϦϯά͢Δෆஅͷྗ͕ٻΊΒΕ͏Δ • ཧతجૅ͔Β๏ମܥͷཧ • ౷੍͞Εͨඇબผར༻ˠҩྍԾ໊Ճใɿ౷ܭྔʹूܭͨ͠σʔλɺ·ͨೋ࣍ར༻ • ݸਓσʔλॲཧத৺ͷنˠॲཧରͱ͠ͳ͍σʔλͷϚεΩϯάɺΦϓτΠϯॲཧͷෛ୲ • ධՁɾܾఆͷదੑ֬อˠબผΞϧΰϦζϜ దੑͰબผͨ͠ڭҭϓϩάϥϜɺ0,ʁ 【提⾔書公表】デジタル社会を駆動する『個⼈データ保護法制』に向けて(GLOCOM六本⽊会議) https://www.glocom.ac.jp/news/news/8540
🦜🔗 &YQFSJNFOUBMύοέʔδׂ • Ϗοάχϡʔε • $7& ੬ऑੑ ΛؚΉػೳΛͯ͢ผύοέʔδ &YQFSJNFOUBM ʹ
• 🦜🔗ίΞͷεϦϜԽ • $PNNVOJUZνΣΠϯͱ͍͏ύοέʔδͷܭըʹݴٴ • ҙຯ͢Δ͜ͱ • ຊ൪Ͱ͑ͳ͍ ˠ ͍͏Δ • ͜ͷऑɺແ੍ݶʹ֦ு͞ΕΔҰํͩͬͨͷͰ-BNCEB-BZFSʹ͍ ͔ͭΒͳ͘ͳΔ ˠ Ұఆͷަ௨ཧ͕͞ΕΔΑ͏ʹͳΔ • จͷ࣮৺తͳΞΠσΞͷ࣮͕ΑΓ13ग़͘͢͠ͳΔ • "84-BNCEBͰͷར༻ • ݱࡏͷαΠζɿґଘϥΠϒϥϦؚΊͨల։ޙαΠζͰ.#ఔ • εϐϯΞοϓʹ͓͓ΉͶඵఔ͔͔Δˠ4MBDL͔Β͏߹ -B[ZϦεφʔϦτϥΠϔομͷνΣοΫͳͲෳͷରࡦ͕ඞཁ
IUUQTUPLZPTFSWFSMFTTEBZTJP ˣ l(FU5JDLFUTz ˣ 𝕏 l4FSWFSMFTT%BZT 5PLZPʹࢀՃΛਃ͠ࠐΈ·ͨ͠ʂz
%":4্࢙࠷ߴͷϥΠϯφοϓ • ߽՚ηογϣϯ • Ωʔϊʔτɿ"84 • αʔόʔϨεͷख़ •
αʔόʔαΠυओମ͔ΒΤοδϑϩϯτͷ։ൃϥΠϑαΠΫϧ ͷมԽ • ੜ"*ͱαʔόʔϨε • ߽՚εϙϯαʔ • "84 • .PNFOUP • 1JOH$"1 5J%# • .JDSPTPGU • ,%%*ΞδϟΠϧ։ൃηϯλʔ • 4FSWFSMFTT0QFSBUJPOT