Upgrade to Pro — share decks privately, control downloads, hide ads and more …

WebGPU를 통한 private 생성 AI의 Hybrid inference - 고석현

Avatar for Lablup Inc. Lablup Inc.
November 28, 2023
130

WebGPU를 통한 private 생성 AI의 Hybrid inference - 고석현

Lablup Conf 2023

Avatar for Lablup Inc.

Lablup Inc.

November 28, 2023
Tweet

More Decks by Lablup Inc.

Transcript

  1. Pikicast Data Lab 컨텐츠, 이미지, 검색, 추천 Company.AI Co Founder

    자연어 대화엔진 Naver에 M A로 exit Naver CLOVA AI Software Platform Hyper Clova LLM Naver Cloud LM Platform SaaS ML Platform Enterprise LLM
  2. WebASM WebASM 은 JS 하위 집합 입니다. WebASM: WebAssembly abbreviated

    Wasm is a binary instruction format for a stack based virtual machine.
  3. WebGPU WebGL의 한계점을 극복하기 위해서 출시 그래픽스 가속을 강점 WebGL:

    Web Graphics Library WebGPU는 webgpu.wasm 형태의 컴파일된 바이너리 파일 형태로 동작
  4. WebGPU Gpu API Apapter 구조를 구현하는 WebASM 형태 WebAssembly abbreviated

    Wasm is a binary instruction format for a stack based virtual machine.
  5. 그래서 어떤 걸 할 수 있나요? Switch Transformers: Scaling to

    Trillion Parameter Models with Simple and Efficient Sparsity
  6. 그래서 어떤 걸 할 수 있나요? 다양한 전문가 모델의 라우터

    디자인 모델 단위와 토큰 단위 그리고 사용자 제어 단위의 전문가 모델을 생각해본다면
  7. 리 랭커 유저가 보는 화면을 직접 이해하고 처리하는 Hybrid inference

    검색 증강 생성 RAG 기술을 통한 구조와 맥락을 이해하는 다중 모델을 통한