재해복구(Disaster Recovery) 뜻과 개념? 재해복구(Disaster Recovery) 뜻과 개념에 대해서 알기 쉽게 설명해주세요. 기업에서 중요하게
재해복구(Disaster Recovery) 뜻과 개념에 대해서 알기 쉽게 설명해주세요. 기업에서 중요하게 다루는 재해복구와 재해복구 계획의 개념에 대해서 알고 싶습니다.
재해복구(Disaster Recovery, DR)란?
"예상치 못한 재해로 인한 시스템 중단 시, 핵심 업무를 빠르게 복구하기 위한 대책"
자연재해(지진, 홍수), 화재, 사이버 공격, 인적 오류 등으로 인해 IT 시스템이 마비되더라도 최소한의 downtime(중단 시간)과 데이터 손실로 복구하는 것을 목표로 합니다.
RTO (Recovery Time Objective): "얼마나 빨리 복구해야 하나?"
예시: "은행 시스템은 장애 발생 후 4시간 이내 재개해야 함" → RTO = 4시간
RPO (Recovery Point Objective): "얼마만큼의 데이터를 잃어도 되나?"
예시: "고객 거래 데이터는 최대 1시간 전 상태로 복구" → RPO = 1시간 (1시간 분량 데이터 손실 허용)
백업: 데이터를 저장하는 것 (복구 보장 X)
재해복구: 백업 + 복구 프로세스 전체를 설계 (예: 클라우드에 대기 시스템 구축)
금전적 손실: 1시간 시스템 다운 → 평균 30만 달러 손실(업종별 차이)
고객 신뢰 하락: SNS 장애 시 이용자 이탈 증가
법적 제재: GDPR(유럽), 금융감독 규정 등 데이터 보호 의무 위반 시 과징금
위험 평가: 화재, 해킹 등 가능한 재해 유형 식별
중요도 분류: "무슨 시스템을 먼저 복구할까?" (예: 결제 시스템 > 내부 메일)
Hot Site: 실시간으로 대기하는 복구센터 (RTO 짧음, 비용 ↑)
Cold Site: 장비만 설치된 공간 (RTO 길지만 저렴)
테스트: 분기별로 모의 재해 훈련 (실제로 복구되는지 확인)
유지보수: 시스템 변경 시 계획도 함께 업데이트
AWS 리전 장애: 여러 지역(Region)에 서비스 분산 → 한 지역 폭우로 다운되어도 다른 지역에서 서비스 지속
랜섬웨어 공격: 3-2-1 백업 원칙 적용 (본사+클라우드+오프라인 저장소에 데이터 복제)