Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Take the FastTrack 3: A Backend.AI approach to...
Search
Lablup Inc.
PRO
November 02, 2025
0
1
Take the FastTrack 3: A Backend.AI approach to LLMOps
Track 1_1615_Lablup Conf 2025_강정석_황은진_송영숙
Lablup Inc.
PRO
November 02, 2025
Tweet
Share
More Decks by Lablup Inc.
See All by Lablup Inc.
Tokens/$ 극대화를 위한 소프트웨어 기술
lablup
PRO
0
0
Backend.AI Continuum을 이용한 AI Product 개발하기
lablup
PRO
1
0
Making Sense of HS Codes: HSense AI System for Automated Tariff Classfication
lablup
PRO
0
0
LLM을 통한 합성 데이터 생성
lablup
PRO
0
0
당신의 기업, AI 전환이 안되는 3가지 이유
lablup
PRO
0
0
Agentic AI를 위한 MCP Sidecar sLM 학습(시도)기
lablup
PRO
0
0
[Keynote] Composable AI, Composable Software
lablup
PRO
0
0
[Keynote] AAA: Agentic, Autonomous, Adaptive Intelligence
lablup
PRO
0
1
우리 서비스의 Redis는 왜 매일 장애가 날까?
lablup
PRO
0
0
Featured
See All Featured
A better future with KSS
kneath
239
18k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Thoughts on Productivity
jonyablonski
71
4.9k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
27k
Build The Right Thing And Hit Your Dates
maggiecrowley
38
2.9k
How to train your dragon (web standard)
notwaldorf
97
6.3k
jQuery: Nuts, Bolts and Bling
dougneiner
65
7.9k
XXLCSS - How to scale CSS and keep your sanity
sugarenia
249
1.3M
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Agile that works and the tools we love
rasmusluckow
331
21k
Product Roadmaps are Hard
iamctodd
PRO
55
11k
Become a Pro
speakerdeck
PRO
29
5.6k
Transcript
None
3 2 Take the FastTrack : A Backend.AI approach to
LLMOps 래블업 주식회사 황은진, 강정석, 송영숙
래래래 래래래래 Chief Researcher Gen AI team leader 래래래 래래래래
Researcher 래래래 래래래래 Software engineer 발표자 소개 황은진 강정석 송영숙
목차 Why? o 2025 래래 래래래래래 래래래 래래래래래래 래래래 래래래래
? o 래래래래래 래래래 래래래 래래래 래래 래래 래래래 래래 o 래래래 래래 Pain point 래 래래 래래 o 2025 래 래래래래래 래래 래래 래래 How! o 래래래 : What’s new in Backend.AI FastTrack o Backend.AI FastTrack 3 래래 래래 : 래래 래래래 래래
2025 년년 년년년년년 년년 래래래래래 래래 (래래 래래 ) •
래래래래 래래 래래래 래래래 래 래래래 래래래래 래래래래 래래 래래래 래래 래래 래래 래 래래 래래 • ChatGPT 래래 래래래 래래 래래래 래래 래래래 래래래래래 래래래래 래래래래래 래래 • 래래래래 래래 래래 래래 래래 래래래 (HAI) 래 래래래래래 래래 래래 래래 (CRFM) 래 래 래래래 래래래 래래래래 AI 래래래 래래래래래 래래 • 래래래 래래 래래래래래래 래래 • 래래 , 래래래래 래래 AI 래 래래 래래래래 래래래 래래래 래래래래 래래래래 래래래 • 래래래래 래래래 래래래 래래래 래래래래래 래래
연산 자원의 투입만 많으면 충분할까?
년년년년년 년년 년 년년년 년년년 년년 년년년 래래래 래래 래
래래 래래래래래 래래래 래래 래래 : https://ko.wikipedia.org /wiki/%ED%8C%8C%EC%9A%B4%EB%8D%B0%EC%9D%B4%EC%85%98_%EB%AA%A8%EB%8D%B8 래래래 래래 : https://proceedings.neurips.cc /paper_files /paper/2015/file/86df7dcfd896fcaf2674f757a2463eba -Paper.pd f • 래래래 래래 - 래래 래래 - 래래 래래래래 래래래 • 래래래래 래래래 래래래래 래래 래래 • 래래래 래 래래 래래래 래래래래래 래래래래 래래 래래래래 래래래래 래래래 래 래 래래래래 래래 래래래래 래래래 래래
우리가 직면한 Pain Point 래래래래 래래래래래래 ... 래래래 래래래래래 래래래래래
래래래 래래래래 래 래래 래 래래 • 래래래 래래래래 래래래 래래 래래래래 래래 IO 래래래 • 래래래래 래래래래 GPU 래래 래래래래 래 래래 래래래 • 래래래 래래래래 래래래래 래래 래래래 래래래래래 래래 래래래 래래래 래래 o Blackwell o MoE 래래 래래래 래래래래 래래 래래래 래래래래래
2025년 파운데이션 모델 개발 전략 1. 비용 최적화 중심 접근
• 래래 래래래 래래래 래래 래래래 래래래 LLMOps 래래래 래래 래래 래래래 → 래래 래래래 래래 • MoE , mixed precision, parallelism • 래래 래래래 래래 → 래래래 래래 래래 래래 <FastTrack 래래 래래래래래 래래 래래래래 래래래래 래래 래래래 >
2025년 파운데이션 모델 개발 전략 2. 협업과 생태계 구축 •
래래 래래 래래래래 래래 래래 래래래 래래 래래 래 래래 래래 래래 래래 래래 • 래래래래 래래래래 래래 : 래래래 래래 래래래 래래 • 래래래 래래 래래 : 래래래래 래래래 래래 2025 PyCon KR
What’s new in Backend.AI FastTrack 3
23.03 24.03 25.14 Backend.AI FastTrack
Backend.AI FastTrack 3
Backend.AI FastTrack 3 래래 래래래래래 래래 래래 래래래래래 래래 래래
래래래래래 (e.g. 래래래 래래 )
• 래래 LLMOps 래래래래 래래래래 Backend.AI 래래래래 MLOps 래래 래래
• 래래래래 래래래 래래래 래래 래래 래래 래래래 래래 • 래래 래래래 래 래래래 래래래 래래 래래래래 래래래래래 래래 LLMOps 년년년 FastTrack 3 년년 년년
MLOps 방식의 변화 LLMOps (by. databricks ) (https://www.databricks.com/glossary/llmops ) •
LLM 래래 래 래래래래래 래래래래 래래래래 래래래 래래래래 래래래 • 래래래래래 래래래 래래래 래래 래래 래래래 래래래 래래 : https://aws.amazon.com/ko/blogs/machine -learning/fmops -llmops -operationalize -generative -ai-and-differences -with-mlops/
MLOps 년년년 년년 – 프롬프트 관리 기존의 프롬프트 관리 체계
→ 파일 쌓기 Backend.AI Approach → 프롬프트 관리 기능 래래래 래래래 래래래 래래래래 래래래래래 래래 |래래 |래래 |래래래 래래래 래 래래 래 래래 래래래래 래래래래 래래 래래 래래래래래래 래래
MLOps 년년년 년년 – 프롬프트 관리
MLOps 년년년 년년 – 프롬프트 관리
• 래래래 래래래래 래래래 래래래래 래래래래 래래 래래 • 래래래
래 래래 래래래 래래래 래래래래 래 래 배포 승인
래래 래 래래래래 래래 래래 래래 래래 래래 배포 승인
– 수동 승인
모니터링 10:33 - create_venv 시작 → "환경 준비 중..." 10:33:12
- create_venv 완료 10:34 - download-dataset 완료 10:34:01 - finetuning 시작 10:40:06 - finetuning
모니터링 – 에러 발생 시
모니터링 – 자동 재실행
모니터링 – 자동 재실행
Backend.AI FastTrack 3 운용 예시: 합성 데이터 생성
FastTrack 3 래 래래래래래 래래 ○ YAML 래래 래래래래래 래래
○ 래래래 래래 래래래래 ○ 래 래래 래래래래래래 래래래 래래 ○ 래래래 래래래래래 래래래 ○ 래래래 래래래래래 AI 래래래래래래 래래 래 래래 ○ Delete 래 래래 래래래 래래래 래래래래 래래 래래 FastTrack 3 운용 예시: 합성 데이터 생성
llm-serving ○ LLM 래래 래래 래래 download-dataset ○ 래래래래 래래래래
래래 ○ 래래 래래래 gen-synth-variants ○ 래래 래래래 래래 래래 ○ 래래래 래래래래 래래래 래래 evaluate ○ 래래래 래래래 래래 래래 ○ 래래래래 래래 래래래 래래 summarize ○ 래래 래래 래 래래래 래래 ○ 래래 래래래 래래 FastTrack 3 운용 예시: 합성 데이터 생성
래래래 래래 래 래래래 래래 래래 , API 래래 ,
래래 래래 래래 래래 1. 래래래 래래 ○ 래래래래래래래래 래래 래래 래래 (e.g. 래래 , 래래래 래래 래래 래 ) ○ 래래 래래래 래래래 래래래 2. 래래 래래 래래 ○ API 래래 래래 래래래 래래래 래래래래 래래래래 래래 래래 3. 래래 래래래 래래 ○ 래래래 래래 , 래래 래래 , 래래래래 , 래래래래 래래래 (e.g. vLLM , Python, etc.) 4. 래래 래래 ○ 래래 /래래 래 래래래 래래 FastTrack 3 운용 예시: 합성 데이터 생성
GUI 래래 래래 래래 래래래래 래래 래래래래래 래래 래래 래래래
래래 ○ 래래래 래래 : llm-service ○ 모델 공개 설정: 래래 ON ( 래래래 래래 ) ○ 임시 실행 (Ephemeral): 래래래래래 래래 래래 래래래 래래 래래래래 래래 래래 FastTrack 3 운용 예시: 합성 데이터 생성
임시 실행(Ephemeral) 모델 서빙 FastTrack 3 운용 예시: 합성 데이터
생성
컴퓨팅 리소스와 실행 환경 설정 ○ LLM 래래 래래래 래래래
래래래 래래 래래 ○ GPU/CPU/ 래래래래 래래 래래래 래래 래래래 ○ 래래래 래래래래 래래 래래래래 래래 ○ 래래 래래래 래래래 래래 래래 래래 래래 래래 FastTrack 3 운용 예시: 합성 데이터 생성
병렬 실행 (Parallel Runs) 래래래 래래래래래래 래래래 래래 래 래래래래
래래래래 래래 ○ 래래 래래 래래 래래 래래 래래 ○ 래 래래래래래 래래래 LLM 래 래래 래래 래래래 래래래 FastTrack 3 운용 예시: 합성 데이터 생성
병렬 실행 (Parallel Runs) 래래래래래 래래 래래 래래 래래 래래래
래 래래래 래 래래 래래래래래래 래래래래 래 래래 래래래 래 래래 ○ Gemma -3-27b -it ○ Llama -3.2 -3B -Instruct ○ Qwen3 -4B -Instruct FastTrack 3 운용 예시: 합성 데이터 생성
• 래래래 래래래 래래래래 래래래 래래 래래래 래래래래 래래 /래래
• 래 : 래래래래 래래 래래 래래래래 래래 (GPU) 래 래래래래 , 래래래 래래래 래래 래래 • 래래 래래래 • 래래래 래래 래래래래래래 래래래 래래래 래래래래 , 래래래래 래래래 래래래 래래래래 래래 래 래래 래래래래래 래래 래래 래래래 래래 래래 FastTrack 3 운용 예시: 합성 데이터 생성
결론 요약 - 기술 고도화: 래래 래래래래 래래 래 래래래래
end -to-end 래 래래 - 편이성 확산: GPU 래래 래래래 래래래래 래래 래래래 래래래 래래 래래 래래 래래래 래래래래 래래래 래래래래 래래 앞으로 나아갈 방향 - 안정성 개선: 래래 래래래 래래 래래래 래래래 래래래래 래래래 래래 래래 - 사용성 개선: 래래래래 래 래래래래 래래래 래래래 - 생태계 확장: 래래래래 래래래래 래래 래 래래래 래래 래래래래 래래
None