Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
WebGPU를 통한 private 생성 AI의 Hybrid inference - 고석현
Search
Lablup Inc.
PRO
November 28, 2023
0
85
WebGPU를 통한 private 생성 AI의 Hybrid inference - 고석현
Lablup Conf 2023
Lablup Inc.
PRO
November 28, 2023
Tweet
Share
More Decks by Lablup Inc.
See All by Lablup Inc.
[2024-01-22] Backend.AI와 거대 언어 모델: 금융 분석에서 비즈니스 인사이트까지
lablup
PRO
0
61
Slipstream : AI 레이싱에서 치고 나가는 방법 - 신정규
lablup
PRO
0
39
하드웨어와 소프트웨어사이 어딘가에서 AI를 외치다 - 김준기
lablup
PRO
0
48
Backend.AI 엔터프라이즈 고객 지원 가나다 - 박종현
lablup
PRO
0
40
변화하는 UI/UX 디자인: 문제 인식과 새로운 방향 - 김수진
lablup
PRO
0
41
GenAI on Backend.AI - 조규진
lablup
PRO
0
48
기획자없이 문어고양이와 살아가는 개발자들의 협업방식 - 강지현, 강시온
lablup
PRO
0
41
음성 뉴비의 Whisper Fine-tuning 해보기 - 최성철
lablup
PRO
0
1k
생성형 AI어디까지 알아보고 오셨어요? - 김현수
lablup
PRO
0
35
Featured
See All Featured
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
10
700
Building an army of robots
kneath
302
42k
Designing Experiences People Love
moore
138
23k
Bootstrapping a Software Product
garrettdimon
PRO
305
110k
Intergalactic Javascript Robots from Outer Space
tanoku
268
27k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
169
50k
Building Your Own Lightsaber
phodgson
102
6.1k
Writing Fast Ruby
sferik
627
61k
How To Stay Up To Date on Web Technology
chriscoyier
788
250k
Keith and Marios Guide to Fast Websites
keithpitt
409
22k
How to train your dragon (web standard)
notwaldorf
88
5.7k
Why Our Code Smells
bkeepers
PRO
334
57k
Transcript
Generative AI WebGPU를 통한 private 생성 AI의 Hybrid inference
Pikicast Data Lab 컨텐츠, 이미지, 검색, 추천 Company.AI Co Founder
자연어 대화엔진 Naver에 M A로 exit Naver CLOVA AI Software Platform Hyper Clova LLM Naver Cloud LM Platform SaaS ML Platform Enterprise LLM
WebASM WebASM 은 JS 하위 집합 입니다. WebASM: WebAssembly abbreviated
Wasm is a binary instruction format for a stack based virtual machine.
WebGPU WebGL의 한계점을 극복하기 위해서 출시 그래픽스 가속을 강점 WebGL:
Web Graphics Library WebGPU는 webgpu.wasm 형태의 컴파일된 바이너리 파일 형태로 동작
WebGPU 2023년 5월 Chrome 113 부터 시범적으로 동작 17년 개념
시연, 21년 5월 이후 표준작업
WebGPU WebGL처럼 완전한 네이티브가 아닌 고수준의 API
WebGPU Gpu API Apapter 구조를 구현하는 WebASM 형태 WebAssembly abbreviated
Wasm is a binary instruction format for a stack based virtual machine.
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요? https://www.linkedin.com/in/aurimas-griciunas
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요? https://www.linkedin.com/in/kyung-hoon-kim-55455387/
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요? https://www.linkedin.com/company/three-sigma-ai
그래서 어떤 걸 할 수 있나요? https://www.linkedin.com/company/three-sigma-ai
그래서 어떤 걸 할 수 있나요? Switch Transformers: Scaling to
Trillion Parameter Models with Simple and Efficient Sparsity
그래서 어떤 걸 할 수 있나요? https://developers.kakao.com/docs/latest/ko/kogpt
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Scaling Expert Language Models
with Unsupervised Domain Discovery
그래서 어떤 걸 할 수 있나요? Branch-Train-Merge: Embarrassingly Parallel Training
of Expert Language Models
그래서 어떤 걸 할 수 있나요? 다양한 전문가 모델의 라우터
디자인 모델 단위와 토큰 단위 그리고 사용자 제어 단위의 전문가 모델을 생각해본다면
그래서 어떤 걸 할 수 있나요?
그래서 어떤 걸 할 수 있나요? 을 베이스로 하는 커스텀
전문가 모델
리 랭커 유저가 보는 화면을 직접 이해하고 처리하는 Hybrid inference
검색 증강 생성 RAG 기술을 통한 구조와 맥락을 이해하는 다중 모델을 통한
리랭커
범용 GPU, NPU RAG
Open Course on Machine Learning Compilation https://discuss.tvm.apache.org/t/establish-tvm-unity- connection-a-technical-strategy/13344
https://tvm.apache.org/2021/12/15/tvm-unity
https://tvm.apache.org/2021/12/15/tvm-unity
https://tvm.apache.org/2021/12/15/tvm-unity
가톨릭대학교 성빈센트병원
가톨릭대학교 성빈센트병원
감사합니다.