さくらのクラウド高火力プランを使って大規模言語モデル(LLM)を動かしてみよう

by Hikaru Ashino

Slide 1

Slide 1 text

2023/06/17 Ϋϥ΢υࣄۀຊ෦ Ϋϥ΢υαʔϏε෦ ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯΛ࢖ͬͯ େن໛ݴޠϞσϧ(LLM)Λಈ͔ͯ͠ΈΑ͏ OSC2023 Online/Hokkaido Ἑ໺ɹޫ ͘͞ΒΠϯλʔωοτגࣜձࣾ

Slide 2

Slide 2 text

2 • ୲౰ۀ຿ • αʔϏεͷόοΫΤϯυ։ൃɺΠϯϑϥ։ൃ • Ӵ੕σʔλϓϥοτϑΥʔϜʮTellusʢςϧʔεʣʯ • ͘͞ΒͷVPSɺ͘͞ΒͷΫϥ΢υ • ܦྺ • 2012 - 2016 ITܥઐ໳ֶߍ4೥՝ఔͰֶͿ ߴ౓ઐ໳࢜ଔ • OSC2012 SendaiͰॳΊͯOSSͷੈքΛ஌Δ • 2013 - 2016 MSPͱϗεςΟϯάΛߦ͏ձࣾʹΞϧόΠτೖࣾ • OpenStackɺLinux KVMΛ༻͍ͨԾ૝؀ڥͷߏஙӡ༻ • OSSͰߏங͞ΕͨγεςϜͷӡ༻ɺτϥϒϧγϡʔςΟϯά • 2016 - ݱ৬ ͘͞ΒΠϯλʔωοτʹ৽ଔೖࣾ • 2017 - 2019 ܳज़ܥେֶӃʹͯ2೥ݚڀ͢Δ ܳज़ֶम࢜ Twitter: @tar_xzvff

Slide 3

Slide 3 text

ձࣾ঺հ 3 ձࣾ֓ཁ ຊࣾॴࡏ஍ େࡕ෎େࡕࢢ๺۠കా1-12-12 ౦ژݐ෺കాϏϧ 11F (2021೥10݄Ҡస) ૑ۀ೥݄೔ 1996೥12݄23೔ ʢձࣾઃཱ: 1999೥8݄17೔ʣ ্৔೥݄೔ 2005೥10݄12೔ʢϚβʔζʣ 2015೥11݄27೔ʢ౦ূҰ෦ʢݱϓϥΠϜ ࢢ৔ʣ΁ࢢ৔มߋʣ ࢿຊۚ 22ԯ5,692ສԁ ैۀһ਺ ࿈݁ 710໊ʢ2022೥3݄຤ʣ άϧʔϓձࣾ ΞΠςΟʔΤϜגࣜձࣾ גࣜձࣾS2i ᓎՖҠಈి৴༗ݶެ࢘ ήώϧϯגࣜձࣾ Ϗοτελʔגࣜձࣾ ϓϥφειϦϡʔγϣϯζגࣜձࣾ IzumoBASEגࣜձࣾ BBSakura Networksגࣜձࣾ ΠϯλʔωοτΠϯϑϥͷఏڙΛओͳࣄۀ಺༰ͱ͠·ͯ͠ɺ େࡕɺ౦ژɺੴङͷ3஍Ҭʹ5ͭͷσʔληϯλʔΛల։

Slide 4

Slide 4 text

ձࣾ঺հ 4 VPSɾΫϥ΢υ σʔληϯλʔ ৽αʔϏε Ծ૝Խٕज़Λ༻͍ɺ 1୆ͷ෺ཧαʔό্ ʹෳ਺ͷԾ૝αʔό Λߏங͠ɺԾ૝ઐ༻ αʔόͱͯ͠෼͚ͨ ྖҬͷ઎༗αʔϏε ߴੑೳαʔόͱ֦ு ੑͷߴ͍ωοτϫʔ ΫΛѹ౗తͳίετ ύϑΥʔϚϯεͰར ༻Ͱ͖ΔIaaSܕύϒ ϦοΫɾΫϥ΢υɾ αʔϏε ߴੑೳͰ֦ுੑͱ৴པੑͷߴ ͍αʔόΛ·Δ͝ͱಠ઎ͯ͠ ར༻͢Δ͜ͱ͕Ͱ͖ɺࣗ༝ʹ ΧελϚΠζͯ͠ར༻Մೳͳ αʔϏε ϋ΢δϯά ϦϞʔτϋ΢δϯά σʔληϯλʔ಺ʹ͓٬༷ઐ ༻ͷϋ΢δϯάεϖʔεΛ֬ อ͠ɺωοτϫʔΫػث΍ αʔόͳͲͷػࡐΛࣗ༝ʹஔ ͚ΔαʔϏε ػցֶशɺσʔλղੳɺߴਫ਼౓γϛϡϨʔγϣϯ༻్ʹಛԽͨ͠GPU౥ࡌͷ ઐ༻αʔόαʔϏε ઐ༻αʔό ͘͞ΒͷηΩϡΞϞόΠϧίωΫτ Ϋϥ΢υʹμΠϨΫτʹ઀ଓ͠ɺηΩϡΞͰ͋Γͭͭ೚ҙͷωοτϫʔΫ΁ ઀ଓՄೳͳSIMΛఏڙ͢ΔɺIoT޲͚ϞόΠϧαʔϏε ̖̞ ਓ޻஌ೳ IoT Ϩϯλϧαʔό 1୆ͷαʔόΛෳ਺ͷܖ໿ऀ ͰαʔόΛڞ༗·ͨ͸઎༗͢ Δ͜ͱ͕Ͱ͖ɺ؅ཧ͸͘͞Β Πϯλʔωοτʹ೚ͤͯ࢖͏ αʔϏε ઐۀͰશํҐʹύϒϦοΫͳαʔϏεΛఏڙ͍ͯ͠Δࠃ಺།Ұͷࣄۀऀ͔ͩΒͦ͜૊Έ߹Θͤͯબ୒ࢶ͕޿͕ΔɺͦΕ͕ʮ͘͞ΒΠϯλʔωοτʯͷڧΈ ೥݄*4."1औಘ ΠϯλʔωοτΠϯϑϥͷఏڙΛࣄۀυϝΠϯʹɺ େࡕ/౦ژ/ੴङʹσʔληϯλʔΛల։ɻ େࡕ/౦ژ/ੴङΛ100GbpsͰ݁ͼͭͭɺ ର֎઀ଓͷ૯ܭ͸ 1.84Tbps ͷωοτϫʔΫͰ ࠃ಺ͷΠϯλʔωοττϥϑΟοΫΛࢧ͍͑ͯ·͢ɻ (2023೥4݄ݱࡏ) ੴङσʔληϯλʔ3߸౩ʢӈଆʣ ੴङσʔληϯλʔશܠ Ӊ஦ Tellus(ςϧʔε)͸ɺ೔ຊൃͷӴ੕σʔλϓϥοτϑΥʔϜͰ͢ɻ Ӵ੕σʔλͷఏڙΛ͸͡Ίͱ͠ɺσʔλΛར༻ͨ͠ ৽ͨͳϏδωεΛ૑ग़͢Δ؀ڥΛ͝༻ҙ͍ͯ͠·͢ɻ

Slide 5

Slide 5 text

ΞδΣϯμ • ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯ֓ཁɺࣄྫ • େن໛ݴޠϞσϧ(LLM)ͱ͸ • ओͳେن໛ݴޠϞσϧ(LLM)ʹ͍ͭͯ • ͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢ΊͷखॱͷղઆɺσϞ • େن໛ݴޠϞσϧΛηϧϑϗετ͢ΔϝϦοτ • ͓஌Βͤ 5

Slide 6

Slide 6 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯ֓ཁɺࣄྫ 6

Slide 7

Slide 7 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯ֓ཁ 7 ͘͞ΒͷΫϥ΢υͰར༻Ͱ͖ΔGPUαʔόϓϥϯ ϋΠ パ ϑΥʔϚϯεͳ GPUʮNVIDIA V100ʯΛॳظඅ༻ෆཁ で 1 ࣌ؒ୯Ґ͔ΒΫϥ΢ ド ͷ࢖͍উखͦͷ··ʹར༻ で ͖Δαʔ ビ ε εϖοΫ ఏڙκʔϯ ੴङୈ̍κʔϯ CPU 4vCPU ϝϞϦ 56GB GPUΧʔυ NVIDIA V100 (32GB) x 1 GPU౥ࡌϝϞϦ 32GB ༻్ྫ: ػցֶशɺσΟʔϓϥʔχϯάɺHPC

Slide 8

Slide 8 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯ֓ཁ 8 ͝ڵຯͷ͋Δ͔ͨ͸ੋඇ͝ཡ͍ͩ͘͞ʂ https://speakerdeck.com/picasa/kuraudonozuo-rifang-gpusababian 2023/2/27 ͘͞ΒͷςοΫϥϯν vol.2 ొஃࢿྉʹͯ։ൃͷ෣୆ཪΛ͝঺հ͓ͯ͠Γ·͢ɻ

Slide 9

Slide 9 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯࣄྫ • ओͳҰྫ • ػցֶशʢϞσϧͷ࡞੒ɺਪ࿦ʣ • ੜ੒AI(Generative AI)ܥ • େن໛ݴޠϞσϧ(LLM) • Ի੠߹੒ • ݚڀ։ൃ • ಈըΤϯίʔυ • VRܥ 9

Slide 10

Slide 10 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯࣄྫ • ػցֶश 10 Ӵ੕σʔλΛ༻͍ͨσʔλ෼ੳΛ͢ΔͨΊͷ Ϟσϧ࡞੒ɾਪ࿦ Ϋϥ΢υGPUମݧه ʙਓ޻Ӵ੕ͷը૾ͰػցֶशΛ΍ͬͯΈͨʙ https://knowledge.sakura.ad.jp/34653/

Slide 11

Slide 11 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯࣄྫ • ػցֶश 11 ΠϯϑΟχοτϧʔϓ͕ࣾʮΧʔτϧʯʹ͘͞ΒͷαʔόʔΛબΜͩཧ༝ https://sakumaga.sakura.ad.jp/entry/2022/01/26/120000

Slide 12

Slide 12 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯࣄྫ • ੜ੒AI(Generative AI)ܥ ը૾ੜ੒ 12 ͘͞ΒͷΫϥ΢υʬGPUϓϥϯʭϋϯζΦϯ ʙStable DiffusionΛ࢖༻ͨ͠ϑΝϯδʔΞʔτͷ࡞Γํ https://qiita.com/zembutsu/items/ae7809501b7e07700cf9 Stable Diffusion web UI https://github.com/AUTOMATIC1111/stable-diffusion-webui

Slide 13

Slide 13 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯࣄྫ • ੜ੒AI(Generative AI)ܥ ίʔσΟϯάΞγελϯτ 13 ͘͞ΒͷΫϥ΢υͷGPUαʔό(Tesla V100)Ͱ Tabby(GitHub Copilotͷ୅ସ)Λಈ͔͢ https://qiita.com/tar_xzvf/items/85ad8b41168921822ef3 Tabby https://github.com/TabbyML/tabby

Slide 14

Slide 14 text

ʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯࣄྫ • େن໛ݴޠϞσϧ(LLM) + νϟοτϘοτ 14 https://note.com/makunugi/n/n90d61ec0423e ձ࿩ܕAIߏஙαʔϏεʮmiiboʯͱOpenCALM ͱ͍͏େن໛ݴޠϞσϧ(LLM)Λܨ͍ͩࣄྫ

Slide 15

Slide 15 text

େن໛ݴޠϞσϧ(LLM)ͱ͸ 15

Slide 16

Slide 16 text

େن໛ݴޠϞσϧ(LLM)ͱ͸ 16

Slide 17

Slide 17 text

େن໛ݴޠϞσϧ(LLM)ͱ͸ 17

Slide 18

Slide 18 text

ओͳେن໛ݴޠϞσϧ(LLM)ʹ͍ͭͯ • GPT(Generative Pre-trained Transformer) • OpenAPI͕։ൃͨ͠ϓϦτϨʔχϯάϞσϧ • https://huggingface.co/gpt2 • ChatGPT͸͜ΕΛ࢖͍ͬͯΔ(GPT3,GPT3.5,GPT4) • BERT(Bidirectional Encoder Representations from Transformers) • Google͕։ൃͨ͠ϓϦτϨʔχϯάϞσϧ • https://huggingface.co/bert-base-uncased • OPT(Open Pre-trained Transformer) • META͕։ൃͨ͠ϓϦτϨʔχϯάϞσϧ • https://huggingface.co/facebook/opt-13b 18

Slide 19

Slide 19 text

Φʔϓϯιʔεେن໛ݴޠϞσϧ(LLM)ʹ͍ͭͯ • Dolly https://huggingface.co/databricks/dolly-v2-12b • Datablicks͕ࣾެ։ 120,70,30ԯύϥϝʔλ • ঎༻ར༻Մೳ • OpenLLaMAɹhttps://huggingface.co/openlm-research/open_llama_7b • OpenLM Research͕ެ։ 130(600ԯτʔΫϯͰֶश),70,30ԯύϥϝʔλɺMeta AI ͷ LLaMA ͷΦʔϓϯιʔε࣮૷ • ঎༻ར༻Մೳ • Falcon https://huggingface.co/tiiuae/falcon-40b • Technology Innovation Institute͕ެ։ 400,70ԯύϥϝʔλ • ঎༻ར༻Մೳ • StableLM https://huggingface.co/stabilityai/stablelm-tuned-alpha-7b • Stability AI͕ެ։ 70,30ԯύϥϝʔλ • ঎༻ར༻Մೳ • OpenCALM l https://huggingface.co/cyberagent/open-calm-7b • CyberAgent͕ެ։ͨ͠೔ຊޠେن໛ݴޠϞσϧɻ࠷େ68ԯύϥϝʔλ • ঎༻ར༻Մೳ • ೔ຊޠGPT-2/BERTͷࣄલֶशϞσϧ https://huggingface.co/rinna • rinna͕ࣾެ։ • MPT-7B https://huggingface.co/mosaicml/mpt-7b • MosaicML͕ެ։ɺ70ԯύϥϝʔλɻ௕จΛಘҙͱ͍ͯ͠Δ • ঎༻ར༻Մೳ 19

Slide 20

Slide 20 text

͘͞ΒͷΫϥ΢υͰ େن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ 20

Slide 21

Slide 21 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ • ࠓճ͸CyberAgent͕ެ։͍ͯ͠ΔOpenCALMΛಈ͔ͯ͠Έ·͢ • OpenCALM • ਺গͳ͍೔ຊޠେن໛ݴޠϞσϧͷҰͭ • Hugging Face※Ͱެ։͞Ε͍ͯΔ 21 ※ػցֶशϞσϧΛެ։ɺڞ༗Ͱ͖ΔϓϥοτϑΥʔϜ αΠόʔΤʔδΣϯτɺಠࣗͷ೔ຊޠLLMʢେن໛ݴޠϞσϧʣΛ։ൃ ―ࣗવͳ೔ຊޠͷจষੜ੒Λ࣮ݱ― https://www.cyberagent.co.jp/news/detail/id=28797

Slide 22

Slide 22 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱɹ͸͡Ίʹ • ͘͞ΒͷΫϥ΢υ௒ೖ໳νϡʔτϦΞϧͷهࣄ͕͍͟͝·͢ • ඞཁʹԠͯ͡͝ཡ͍ͩ͘͞ 22 https://qiita.com/zembutsu/items/538aa0a0211f9200b6c5

Slide 23

Slide 23 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̍ • ͘͞ΒΠϯλʔωοτձһIDɺʮ͘͞ΒͷΫϥ΢υʯΞΧ΢ϯτ࡞੒ • αʔϏε͝ར༻ͷྲྀΕ https://cloud.sakura.ad.jp/flow/ 23

Slide 24

Slide 24 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̎ • ͘͞ΒͷΫϥ΢υʹϩάΠϯ • https://secure.sakura.ad.jp/cloud/ ͔ΒϩάΠϯ 24

Slide 25

Slide 25 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̏ • GPUαʔόͷ࡞੒ • αʔό௥Ճը໘Ͱ֤߲໨Λબ୒ 25 ߲໨໊ ஋ αʔόϓϥϯ GPUϓϥϯ σΟεΫ-σΟεΫϓϥϯ SSDϓϥϯ σΟεΫ-σΟεΫιʔε ΞʔΧΠϒ ΞʔΧΠϒબ୒ Ubuntu 22.04.1 LTS σΟεΫ-σΟεΫαΠζ 100GB σΟεΫमਖ਼-σΟεΫमਖ਼Λ͢Δ νΣοΫ ؅ཧϢʔβͷύεϫʔυ ೚ҙͷύεϫʔυΛೖྗ ϗετ໊ɺެ։伴 ※ඞཁʹԠͯ͡ೖྗɾબ୒ αʔόͷ৘ใ-໊લ Θ͔Γ΍͍͢೚ҙͷ໊લ ࡞੒਺ 1

Slide 26

Slide 26 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̐ • αʔόͷ࡞੒׬ྃ·Ͱ଴ͭ • ͍͍ͩͨ10෼΄ͲͰ࡞੒׬ྃʹͳΓ·͢ 26

Slide 27

Slide 27 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̑ • αʔόʹSSHϩάΠϯ • αʔό࡞੒࣌ʹઃఆͨ͠ɺύεϫʔυ·ͨ͸SSH伴Λ༻͍ͯϩάΠϯ 27

Slide 28

Slide 28 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̒ • GPUυϥΠόͷΠϯετʔϧ • NVIDIAࣾͷυΩϡϝϯτ௨ΓʹΠϯετʔϧΛߦ͍·͢ • https://docs.nvidia.com/datacenter/tesla/tesla-installation-notes/index.html 28 $ sudo apt-get install linux-headers-$(uname -r) $ distribution=$(. /etc/os-release;echo $ID$VERSION_ID | sed -e 's/\.//g') $ wget https://developer.download.nvidia.com/compute/cuda/repos/$distribution/x86_64/cuda-keyring_1.0-1_all.deb $ sudo dpkg -i cuda-keyring_1.0-1_all.deb $ sudo apt-get update $ sudo apt-get -y install cuda-drivers

Slide 29

Slide 29 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̓ • PythonϥΠϒϥϦͷΠϯετʔϧ • OpenCALM(LLM)ΛPythonͰѻ͏ͨΊʹϥΠϒϥϦΛΠϯετʔϧ͠·͢ 29 $ sudo apt install python3-pip $ pip3 install transformers accelerate

Slide 30

Slide 30 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̔ • αϯϓϧίʔυͷ࣮ߦ • Hugging FaceͰެ։͞Ε͍ͯΔɺOpenCALMͷαϯϓϧίʔυΛಈ͔͠·͢ • https://huggingface.co/cyberagent/open-calm-7b 30 import torch from transformers import AutoModelForCausalLM, AutoTokenizer model = AutoModelForCausalLM.from_pretrained("cyberagent/open-calm-7b", device_map="auto", torch_dtype=torch. fl oat16) tokenizer = AutoTokenizer.from_pretrained("cyberagent/open-calm-7b") inputs = tokenizer("AIʹΑͬͯࢲୡͷ฻Β͠͸ɺ", return_tensors="pt").to(model.device) with torch.no_grad(): tokens = model.generate( **inputs, max_new_tokens=64, do_sample=True, temperature=0.7, top_p=0.9, repetition_penalty=1.05, pad_token_id=tokenizer.pad_token_id, ) output = tokenizer.decode(tokens[0], skip_special_tokens=True) print(output)

Slide 31

Slide 31 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ̔ • αϯϓϧίʔυͷ࣮ߦ 31

Slide 32

Slide 32 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ • αϯϓϧίʔυΛ༻͍ͯOpenCALM(LLM)͕͘͞ΒͷΫϥ΢υ্Ͱಈ͖·ͨ͠ • ৄࡉͳखॱ΍΋ͬͱ؆୯ʹಈ͔ͨ͢ΊͷखॱͷهࣄΛ༻ҙ͠·ͨ͠ • cloud-initͷίʔυ΋༻ҙ͍ͯ͠·͢ɺίϐϖͰ؀ڥ͕ߏஙͰ͖·͢ 32 ͘͞ΒͷΫϥ΢υͷGPUαʔό(Tesla V100)Ͱ αΠόʔΤʔδΣϯτ͕Ұൠެ։ͨ͠೔ຊޠLLM(OpenCALM)Λಈ͔ͯ͠ΈΔ https://qiita.com/tar_xzvf/items/09ee2bf146c4a3319492

Slide 33

Slide 33 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧΛಈ͔ͨ͢Ίͷखॱ • ͜ΕͰ༷ʑͳ΋ͷͱ૊Έ߹ΘͤͯLLMΛಈ͔ͤΔΑ͏ʹͳΓ·͢ • Ұྫͱͯ͠HTTP API͔ΒLLMΛ࢖͑ΔΑ͏ʹͨ͠Γ 33 ೔ຊޠLLM(OpenCALM)ΛHTTP API͔Β࢖͑ΔΑ͏ʹ͢Δ https://qiita.com/tar_xzvf/items/fc8f547b6a1706791d4a

Slide 34

Slide 34 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧͷσϞ 34

Slide 35

Slide 35 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧͷσϞ • ࠓճ͸LLMΛ࢖ͬͯνϟοτϘοτͷσϞΛ͠·͢ • LLM͸OpenCALMΛ࢖༻ • ձ࿩ܕAIߏஙαʔϏεʮmiiboʯͱ͘͞ΒͷΫϥ΢υͰಈ͘LLMΛ࿈ܞ 35 OpenCALM

Slide 36

Slide 36 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧͷσϞɹΞʔΩςΫνϟ • ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯͷαʔό্ʹOpenCALMΛ༻ҙAPIΛ࣮૷ • Fast APIͰ transformerϞσϧ(OpenCALM)Λݺͼग़͢APIΛ࣮૷ • Fast API͸ϦΫΤετʹจষΛड෇ɺͦΕΛOpenCALMʹೖྗ • OpenCALM͔Βͷग़ྗΛAPIϨεϙϯεͱͯ͠ฦ͢ 36 OpenCALM ͓ݩؾ? ͓ݩؾ? ݩؾͰ͢ ݩؾͰ͢

Slide 37

Slide 37 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧͷσϞ • σϞ̍ 37

Slide 38

Slide 38 text

͘͞ΒͷΫϥ΢υͰେن໛ݴޠϞσϧͷσϞ • σϞ̎ 38

Slide 39

Slide 39 text

େن໛ݴޠϞσϧΛηϧϑϗετ͢ΔϝϦοτ • ಛఆλεΫΛ࣮ߦ͢ΔͨΊʹΧελϚΠζͨ͠LLMΛ࢖͍͍ͨχʔζ • λεΫݻ༗ͷσʔληοτͰϑΝΠϯνϡʔχϯά͢Δ • σʔληΩϡϦςΟͱϓϥΠόγʔ • ֎෦ʹग़ͤͳ͍σʔλΛ࢖ͬͨLLMͷ׆༻ • σʔλ࿙ӮͳͲͷ؍఺͔Β • ΦϯϓϨϛεͷԸܙ • ΋͠େن໛ݴޠϞσϧΛಈ͔ͤΔΠϯϑϥ͕͋ΔͷͰ͋Ε͹ɺैྔ՝ۚͳͲؾʹ ͤͣʹϞσϧΛಈ͔͢͜ͱ͕Ͱ͖Δɺίετίϯτϩʔϧ • ࠷దԽ(ࣗ૊৫಺ʹஔ͘ͷͰɺԠ౴͕஗ͯ͘΋վળͰ͖ΔՄೳੑ͕͋Δ) • ͨͩ͠ిؾ୅͕͍͢͜͝ͱʹͳΓͦ͏💸 39

Slide 40

Slide 40 text

ײ૝ • ಈ͔͢·Ͱͷखॱ͕γϯϓϧͰ͙͢ʹಈ͔ͤͨ • GPUυϥΠόͱPythonϥΠϒϥϦͷΠϯετʔϧ͚ͩ • ࣗ༝౓͕ߴͦ͏ɺ൚༻తʹ૊ΈࠐΜͩΓͰ͖ͦ͏ • HTTP APIͱͯ͠ଞαʔϏεͱܨ͍ͩΓɺslack botʹͨ͠Γ • ΋͏͢͜͠ਫ਼౓͕΄͍͠ • Ԡ౴͕ͪΐͬͱظ଴͸ͣΕͷ࣌΋͋Δ • ϑΝΠϯνϡʔχϯάͯ͠Έ͍ͨ • ۀ຿Ͱ׆༻ͯ͠Έ͍ͨ • ࣗࣾΫϥ΢υͰ΋ಈ͘͜ͱ͕෼͔Γخ͍͠ • ҟͳΔGPUͰ΋ࠓޙݕূͯ͠Έ͍ͨͰ͢ • LLMΛ׆༻ͯ͠Έ͍ͨɺਂ۷Γͯ͠Έ͍ͨɺ࡞ͬͯΈ͍ͨ • ·ͣ͸ػցֶशΛ͸͡Ί͔Βֶͼ͍ͨͱࢥ͍·͢ 40

Slide 41

Slide 41 text

ࠂ஌ ͓஌Βͤ 41

Slide 42

Slide 42 text

ࠂ஌ • 6/21(ਫ) ͘͞ΒͷςοΫϥϯν vol.4 (ΦϯϥΠϯ) 42 ͘͞ΒͷΤϯδχΞ͕ٕज़ʹ͍ͭͯ࿩͢ϥϯνλΠϜ https://sakura-tokyo.connpass.com/event/286404/

Slide 43

Slide 43 text

ࠂ஌ • 6/24(౔) Open Source Conference 2023 Hokkaido (లࣔ) 43 GPUαʔόʔΛ࣌ؒ୯ҐͰར༻Մೳͳʮ͘͞ΒͷΫϥ΢υߴՐྗϓϥϯʯΛ͝঺հ͠·͢ɻ ͋Θͤͯɺάοζ΍Ϋʔϙϯͷ഑෍΋ߦ͍·͢ɻ ࠓճͷσϞ΋లࣔ͠·͢ʂ https://ospn.connpass.com/event/285754/

Slide 44

Slide 44 text

ࠂ஌ • 7/19(ਫ) ʲಓ๺ฤʳ͘͞Βͷશࠃߦ٭ΦϯϥΠϯΠϕϯτ 44

Slide 45

Slide 45 text

͘͞ΒΠϯλʔωοτͰ͸Τϯ ジ χΞ࠾༻ΛڧԽ͍ͯ͠·͢ ͘͞ΒΠϯλʔωοτ͸৽ͨͳΞΠ デ Ξͷ૑ग़ʹڧ͍೤ҙͱ৘೤Λ࣋ͬͯ௅ઓ͢Δ͓٬༷Λ͸ じ Ίɺࢲͨͪͱͭͳ が Γͷ͋Δ͢ べ ͯͷਓͨͪͷͨΊʹɺະདྷͷ͋Δ べ ͖࢟Λ૝͍ඳ͖ͳ が Β ― ʮ΍Γ͍ͨ͜ͱʯΛʮ で ͖Δʯʹม͑Δ ― ͋ΒΏΔΞ プ ϩʔνΛ “Πϯλʔωοτ”Λ௨ じ ͯఏ ڙ͠·͢ɻ SAKURA internet ࣾձΛࢧ͑Δ   ύϒϦοΫΫϥ΢υΛ   Ұॹʹ࡞Γ·ͤΜ͔ʁ ιϑτ΢ΣΞ։ൃɺ Πϯϑϥج൫͔Β ϑϩϯτΤϯυ·Ͱ ࠾༻ڧԽத! ৄ͘͠͸WebαΠτʹͯɺΧδϡΞϧ໘ஊ΋΍ͬͯ·͢ 👉 www.sakura.ad.jp/lp/22engineer/

Slide 46

Slide 46 text

46 ͝ڵຯͷ͋Δ͔ͨ͸ੋඇ͝ཡ͍ͩ͘͞ʂ https://speakerdeck.com/picasa/kuraudonozuo-rifang-gpusababian 2023/2/27 ͘͞ΒͷςοΫϥϯν vol.2 ొஃࢿྉʹͯ։ൃͷ෣୆ཪΛ͝঺հ͓ͯ͠Γ·͢ɻ

Slide 47

Slide 47 text

47 ͝ਗ਼ௌ͋Γ͕ͱ͏͍͟͝·ͨ͠ʂ