Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
WebGPU를 통한 private 생성 AI의 Hybrid inference - 고석현
Search
Lablup Inc.
PRO
November 28, 2023
0
95
WebGPU를 통한 private 생성 AI의 Hybrid inference - 고석현
Lablup Conf 2023
Lablup Inc.
PRO
November 28, 2023
Tweet
Share
More Decks by Lablup Inc.
See All by Lablup Inc.
기업을 위한 생성형 AI 솔루션
lablup
PRO
0
9
Uncharted AI: 대AI시대
lablup
PRO
0
24
What's new on FastTrack MLOps
lablup
PRO
0
15
Backend.AI 와 AI 칩의 하모니: AI 하드웨어의 모든 음색을 한 무대에!
lablup
PRO
0
19
Advancing UI/UX for GenAI and Hybrid AI-김수진, 이종은
lablup
PRO
0
15
쇼생크 (못)탈출: 폐쇄망에서의 AI 개발 및 서비스-성대현
lablup
PRO
0
24
인공지능의 씨앗을!: 인공지능 중싱 사업융합 집적단지 조성사업 소개
lablup
PRO
0
13
kt cloud의 AI 사업 성장기, 이래서 파트너가 중요합니다.-황성진(kt cloud)
lablup
PRO
0
13
AI를 활용하기 위해 VectorDB는 필수 인가요? RDB로 VectorDB를 만들수는 없을까요? - 강성욱
lablup
PRO
0
37
Featured
See All Featured
RailsConf 2023
tenderlove
29
940
The Language of Interfaces
destraynor
155
24k
GraphQLとの向き合い方2022年版
quramy
44
13k
Into the Great Unknown - MozCon
thekraken
34
1.5k
The Invisible Side of Design
smashingmag
298
50k
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
120k
It's Worth the Effort
3n
183
28k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
29
920
Fashionably flexible responsive web design (full day workshop)
malarkey
405
66k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
111
49k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Transcript
Generative AI WebGPU를 통한 private 생성 AI의 Hybrid inference
Pikicast Data Lab 컨텐츠, 이미지, 검색, 추천 Company.AI Co Founder
자연어 대화엔진 Naver에 M A로 exit Naver CLOVA AI Software Platform Hyper Clova LLM Naver Cloud LM Platform SaaS ML Platform Enterprise LLM
WebASM WebASM 은 JS 하위 집합 입니다. WebASM: WebAssembly abbreviated
Wasm is a binary instruction format for a stack based virtual machine.
WebGPU WebGL의 한계점을 극복하기 위해서 출시 그래픽스 가속을 강점 WebGL:
Web Graphics Library WebGPU는 webgpu.wasm 형태의 컴파일된 바이너리 파일 형태로 동작
WebGPU 2023년 5월 Chrome 113 부터 시범적으로 동작 17년 개념
시연, 21년 5월 이후 표준작업
WebGPU WebGL처럼 완전한 네이티브가 아닌 고수준의 API
WebGPU Gpu API Apapter 구조를 구현하는 WebASM 형태 WebAssembly abbreviated
Wasm is a binary instruction format for a stack based virtual machine.
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요? https://www.linkedin.com/in/aurimas-griciunas
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요? https://www.linkedin.com/in/kyung-hoon-kim-55455387/
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요? https://www.linkedin.com/company/three-sigma-ai
그래서 어떤 걸 할 수 있나요? https://www.linkedin.com/company/three-sigma-ai
그래서 어떤 걸 할 수 있나요? Switch Transformers: Scaling to
Trillion Parameter Models with Simple and Efficient Sparsity
그래서 어떤 걸 할 수 있나요? https://developers.kakao.com/docs/latest/ko/kogpt
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Branch-Train-Merge: Embarrassingly Parallel Training
of Expert Language Models
그래서 어떤 걸 할 수 있나요? 다양한 전문가 모델의 라우터
디자인 모델 단위와 토큰 단위 그리고 사용자 제어 단위의 전문가 모델을 생각해본다면
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요? 을 베이스로 하는 커스텀
전문가 모델
리 랭커 유저가 보는 화면을 직접 이해하고 처리하는 Hybrid inference
검색 증강 생성 RAG 기술을 통한 구조와 맥락을 이해하는 다중 모델을 통한
리랭커
범용 GPU, NPU RAG
Open Course on Machine Learning Compilation https://discuss.tvm.apache.org/t/establish-tvm-unity- connection-a-technical-strategy/13344
https://tvm.apache.org/2021/12/15/tvm-unity
https://tvm.apache.org/2021/12/15/tvm-unity
https://tvm.apache.org/2021/12/15/tvm-unity
가톨릭대학교 성빈센트병원
가톨릭대학교 성빈센트병원
감사합니다.