Upgrade to Pro — share decks privately, control downloads, hide ads and more …

1. 데이터센터 단위의 다중화를 위한 고민

kakao
PRO
December 08, 2022

1. 데이터센터 단위의 다중화를 위한 고민

#HA #DR

지난 10월 15일, 카카오가 사용하고 있던 SKC&C 판교 데이터센터에 화재가 났습니다. 이로 인해 카카오 전체 서버의 1/3의 전원이 꺼지면서 서비스에 장시간 장애가 발생하여, 이용자분들에게 많은 불편을 드렸습니다.

그 후 카카오는 '데이터센터 단위로 어떻게 다중화를 해야 이번과 같은 화재시에도 장애를 최소화 할 수 있는지' 광범위하고 깊은 원인 분석을 했고, 해결책을 고민하고 오늘도 계속 보완/실행해가고 있습니다.
이번 이프카카오에서 '1015장애 회고' 트랙을 통해, 각 시스템 레이어별로 어떻게 다중화할지 그 방안을 상세히 공유드리고자 합니다.

'1015장애 회고' 트랙은 다음과 같이 총 5개의 발표로 구성하였습니다. 그리고 이 영상은 "1. 데이터센터 단위의 다중화를 위한 고민"부분으로, 이번 화재 사고 개요 및 인터넷/모바일 서비스를 위한 시스템 구성 등에 대한 개요를 설명드립니다.

1. 데이터센터 단위의 다중화를 위한 고민
2. 인프라 설비 레이어 다중화
3. 데이터 레이어 다중화
4. 서비스 플랫폼 레이어 다중화
5. 애플리케이션 레이어 다중화

발표자 : indy.jones
카카오에서 회원플랫폼사업실을 맡고 있는 indy 입니다.

kakao
PRO

December 08, 2022
Tweet

More Decks by kakao

Other Decks in Programming

Transcript

  1. 1. 데이터센터 단위의 다중화를 위한 고민 if(kakao)2022 유용하 (indy.jones) 카카오

    Copyright 2022. Kakao Corp. All rights reserved. Redistribution or public display is not permitted without written permission from Kakao.
  2. 경험에 의한 기술적 발전 문제 분석 해결 방안 검증 발전

  3. 문제 분석 해결 방안 검증 발전 1015 경험과 지식의 공유

    경험과 지식의 공유
  4. 카카오의 데이터센터 (2022) DC 3 DC 2 DC 4 DC

    1(판교) 3.2만 대
  5. 카카오의 데이터센터 (2022) DC 3 DC 2 DC 4 DC

    1(판교) 3.2만 대
  6. 모든 레이어에서 다중화 대비가 되어 있어야 데이터센터 규모의 완전한 이중화

    동작 서비스를 위한 기술적 레이어 애플리케이션 서비스 플랫폼 운영 및 관리 도구 데이터 인프라 설비
  7. 상면, 전력, 네트워크 등 서비스를 위한 기술적 레이어 애플리케이션 서비스

    플랫폼 운영 및 관리 도구 데이터 인프라 설비
  8. 각종 데이터베이스, 빅데이터 플랫폼 등 서비스를 위한 기술적 레이어 애플리케이션

    서비스 플랫폼 운영 및 관리 도구 데이터 인프라 설비
  9. 권한관리, 소스관리, CI/CD, 라이브러리 저장소, 빌드, 배포, 문서, 모니터링 등

    서비스를 위한 기술적 레이어 애플리케이션 서비스 플랫폼 운영 및 관리 도구 데이터 인프라 설비
  10. 클라우드 및 서비스 플랫폼 도구 서비스를 위한 기술적 레이어 애플리케이션

    서비스 플랫폼 운영 및 관리 도구 데이터 인프라 설비
  11. 서비스를 위한 컴포넌트 구성 및 소프트웨어 서비스를 위한 기술적 레이어

    애플리케이션 서비스 플랫폼 운영 및 관리 도구 데이터 인프라 설비
  12. 정리 애플리케이션 서비스 플랫폼 운영 및 관리 도구 데이터 인프라

    설비 서비스를 위한 컴포넌트 구성 및 소프트웨어 클라우드 및 서비스 플랫폼 도구 권한관리, 소스관리, 빌드, 배포, 문서, 모니터링 각종 데이터베이스, 빅데이터 플랫폼 상면, 전력, 네트워크