Upgrade to Pro — share decks privately, control downloads, hide ads and more …

WebGPU를 통한 private 생성 AI의 Hybrid inference - 고석현

Lablup Inc.
November 28, 2023
86

WebGPU를 통한 private 생성 AI의 Hybrid inference - 고석현

Lablup Conf 2023

Lablup Inc.

November 28, 2023
Tweet

More Decks by Lablup Inc.

Transcript

  1. Pikicast Data Lab 컨텐츠, 이미지, 검색, 추천 Company.AI Co Founder

    자연어 대화엔진 Naver에 M A로 exit Naver CLOVA AI Software Platform Hyper Clova LLM Naver Cloud LM Platform SaaS ML Platform Enterprise LLM
  2. WebASM WebASM 은 JS 하위 집합 입니다. WebASM: WebAssembly abbreviated

    Wasm is a binary instruction format for a stack based virtual machine.
  3. WebGPU WebGL의 한계점을 극복하기 위해서 출시 그래픽스 가속을 강점 WebGL:

    Web Graphics Library WebGPU는 webgpu.wasm 형태의 컴파일된 바이너리 파일 형태로 동작
  4. WebGPU Gpu API Apapter 구조를 구현하는 WebASM 형태 WebAssembly abbreviated

    Wasm is a binary instruction format for a stack based virtual machine.
  5. 그래서 어떤 걸 할 수 있나요? Switch Transformers: Scaling to

    Trillion Parameter Models with Simple and Efficient Sparsity
  6. 그래서 어떤 걸 할 수 있나요? 다양한 전문가 모델의 라우터

    디자인 모델 단위와 토큰 단위 그리고 사용자 제어 단위의 전문가 모델을 생각해본다면
  7. 리 랭커 유저가 보는 화면을 직접 이해하고 처리하는 Hybrid inference

    검색 증강 생성 RAG 기술을 통한 구조와 맥락을 이해하는 다중 모델을 통한