1️. Disaster Recovery

Disaster(재해) 비즈니스 연속성 또는 재무 상태에 부정적 영향을 주는 모든 이벤트

Disaster Recovery(DR)의 목적

  • 재해에 대비
  • 재해 발생 시 복구

DR 시나리오 유형

  • On-Premise → On-Premise

    → 전통적 DR, 매우 고비용

  • On-Premise → AWS Cloud

    Hybrid Recovery

  • AWS Region A → AWS Region B

    Multi-Region DR


2️. RPO & RTO

RPO (Recovery Point Objective)

  • 허용 가능한 데이터 손실 시점
  • 마지막 백업 이후 얼마나 데이터 손실을 감수할 수 있는가

RTO (Recovery Time Objective)

  • 허용 가능한 서비스 중단 시간
  • 얼마나 빨리 서비스를 복구해야 하는가
Disaster 발생
 ├─ RPO →Data Loss 허용 범위
 └─ RTO → Downtime 허용 범위

3️. Disaster Recovery 전략 종류

RTO가 짧아질수록 비용은 증가

  1. Backup & Restore
  2. Pilot Light
  3. Warm Standby
  4. Hot Site / Multi-Site

4️. Backup & Restore 전략 (High RPO)

특징

  • 가장 단순
  • 가장 저렴
  • RPO / RTO 가장 큼

구성 요소

  • S3 / S3 IA / Glacier
  • EBS Snapshot
  • RDS Snapshot
  • AMI
  • Snowball / Storage Gateway

아키텍처 흐름

On-Prem /Primary
 ├─ EBSSnapshot
 ├─ RDSSnapshot
 ├─ AMI
 └─ S3 / Glacier (Lifecycle)
        ↓
Disaster 발생
        ↓
AWS Cloud
 ├─ EC2 (AMI 복원)
 └─ RDS (Snapshot 복원)

5️. Pilot Light 전략

핵심 시스템만 항상 켜져 있는 상태

특징

  • Backup & Restore와 유사
  • 핵심 DB는 항상 실행
  • EC2는 중단 상태
  • RTO는 Backup & Restore보다 짧음

아키텍처

On-Prem
 └─ Data Replication
      ↓
AWS Cloud
 ├─ RDS (Running)
 ├─ EC2 (Stopped)
 └─ Route53

6️. Warm Standby 전략

전체 시스템이 최소 규모로 항상 실행

특징

  • 전체 스택이 동작 중
  • 장애 시 스케일 업
  • 비용과 RTO의 균형점

아키텍처

On-Prem
 └─ DataReplication
      ↓
AWS Cloud
 ├─ RDSReadReplica (Running)
 ├─ EC2 Auto Scaling (Min)
 ├─ ELB
 └─ Route53 Failover

7️. Hot Site / Multi-Site 전략

Active-Active 운영

특징

  • 매우 낮은 RTO (초~분)
  • 가장 비싼 전략
  • 전체 프로덕션 스케일 상시 운영

아키텍처

On-Prem / Region A
 ├─ ELB
 ├─ EC2 ASG (Prod)
 └─ DB (Master)

AWS / Region B
 ├─ ELB
 ├─ EC2 ASG (Prod)
 └─ DB (Replica)

Route53 → Active-Active

8️. All AWS Multi-Region DR

AWS 네이티브 구성

RegionA
 ├─ALB
 ├─EC2ASG
 └─AuroraGlobal(Writer)

RegionB
 ├─ALB
 ├─EC2ASG
 └─AuroraGlobal(Reader)

Route53 →Failover/Active-Active

9️. Disaster Recovery 핵심

Backup

  • EBS Snapshot
  • RDS Automated Backup / Snapshot
  • S3 + Lifecycle + CRR
  • Snowball / Storage Gateway

High Availability

  • Route 53 Failover
  • RDS Multi-AZ
  • ElastiCache Multi-AZ
  • EFS / S3

Replication

  • RDS Cross-Region Replica
  • Aurora Global Database
  • On-Prem DB → RDS Replication

Automation

  • CloudFormation / Elastic Beanstalk
  • CloudWatch Alarm → EC2 Recover
  • Lambda 자동화
  • Chaos Engineering (Netflix Simian Army)

10. AWS DMS (Database Migration Service)

데이터베이스 마이그레이션 서비스

특징

  • 소스 DB 중단 없이 마이그레이션
  • 자동 복구(Self-healing)
  • CDC 기반 지속 복제

마이그레이션 유형

  • Homogeneous
    • Oracle → Oracle
  • Heterogeneous
    • SQL Server → Aurora

기본 구조

Source DB
 └─ DMS Replication Instance (EC2)
     └─ Target DB

1️1. DMS 소스 & 타겟

Sources

  • On-Prem / EC2: Oracle, SQL Server, MySQL, PostgreSQL, MongoDB 등
  • Amazon RDS (Aurora 포함)
  • Amazon S3
  • Azure SQL Database

Targets

  • Amazon RDS
  • Redshift
  • DynamoDB
  • S3
  • OpenSearch
  • Kinesis
  • Kafka
  • Neptune / DocumentDB
  • Redis / Babelfish

1️2. AWS Schema Conversion Tool (SCT)

DB 엔진 변경 시 스키마 변환

사용 목적

  • Oracle / SQL Server → MySQL / PostgreSQL / Aurora
  • Teradata / Oracle → Redshift

특징

  • 동일 엔진 마이그레이션 시 불필요
  • 컴퓨트 집약적 → 고성능 인스턴스 권장
Source DB
 ├─ SCT (Schema 변환)
 └─ DMS (Data 복제)
Target DB

1️3. DMS Continuous Replication

전체 흐름

On-Prem Oracle
 └─ DMSReplication Instance
     ├─FullLoad
     └─ CDC
          ↓
Amazon RDS MySQL
  • SCT 서버 별도 사용

1️4. DMS Multi-AZ 배포

특징

  • Standby Replication Instance 자동 생성
  • AZ 간 동기 복제
  • I/O Freeze 제거
  • 지연 시간 스파이크 최소화

1️5. RDS & Aurora MySQL 마이그레이션

RDS MySQL → Aurora MySQL

  1. RDS Snapshot → Aurora Restore
  2. Aurora Read Replica 생성 → Promote

External MySQL → Aurora MySQL

  1. Percona XtraBackup → S3 → Aurora
  2. mysqldump → Aurora
  3. DMS 사용 (운영 중 DB)

1️6. RDS & Aurora PostgreSQL 마이그레이션

RDS PostgreSQL → Aurora PostgreSQL

  • Snapshot Restore
  • Read Replica Promote

External PostgreSQL

  • Backup → S3
  • aws_s3 확장으로 Import
  • 또는 DMS

1️7. On-Premise → AWS 마이그레이션 전략

주요 서비스

  • Amazon Linux 2 VM 이미지 사용
  • VM Import / Export
  • AWS Application Discovery Service
  • AWS Migration Hub
  • AWS DMS
  • AWS Server Migration Service (SMS)
  • AWS Application Migration Service (MGN)

1️8. AWS Backup

중앙 집중형 백업 서비스

지원 리소스

  • EC2 / EBS
  • S3
  • RDS / Aurora / DynamoDB
  • EFS / FSx
  • Storage Gateway
  • DocumentDB / Neptune

특징

  • Cross-Region / Cross-Account
  • PITR 지원
  • 태그 기반 정책

1️9. Backup Plan 구성

설정 요소

  • 백업 주기 (시간 / 일 / 주 / 월 / Cron)
  • Backup Window
  • Cold Storage 전환 시점
  • Retention 기간
Backup Plan
 └─ Tag 기반 리소스 자동 백업
     └─ S3 (내부 저장)

2️0. AWS Backup Vault Lock

WORM (Write Once Read Many)

특징

  • 백업 삭제 / 보존기간 변경 불가
  • Root 계정도 삭제 ❌
  • 랜섬웨어 대응

2️1. AWS Application Discovery Service

목적

  • 온프레미스 서버 분석
  • 의존성 매핑
  • 리소스 사용량 수집

방식

  • Agentless
  • Agent-based

→ 결과는 AWS Migration Hub에서 시각화


2️2. AWS Application Migration Service (MGN)

CloudEndure 기반 Lift & Shift

특징

  • 지속적 블록 단위 복제
  • 최소 다운타임
  • 물리 / 가상 / 클라우드 서버 지원

흐름

SourceServer
 └─Replication Agent
     └─ Staging Area
         └─ Cutover
             └─ Target EC2

2️3. VMware Cloud on AWS

사용 배경

  • 기존 VMware 운영 환경 유지
  • DR / 확장 목적

아키텍처

On-Prem vCenter
 └─ VMware Cloudon AWS
     ├─ vSphere
     ├─ DirectConnect
     └─ AWS Services (S3, RDS, FSx)

2️4. 대용량 데이터 전송 전략 비교

예: 200TB 데이터

인터넷 (100Mbps)

  • 185일

Direct Connect (1Gbps)

  • 18.5일
  • 설치까지 1개월+

Snowball

  • 2~3대 병렬 사용
  • 약 1주
  • DMS와 병행 가능

지속 복제

  • VPN / DX + DMS
  • DataSync

✅ DR & Migration 요약

RPO / RTO 정의 → DR 전략 선택 → 데이터 복제 → 자동화 → 정기 테스트