1️-1. Amazon CloudWatch Metrics

개념

  • CloudWatch는 AWS 모든 서비스의 메트릭 제공
  • Metric: 모니터링 대상 변수
    • 예: CPUUtilization, NetworkIn
  • Namespace: 메트릭 그룹
  • Dimension: 메트릭의 속성
    • 예: InstanceId, Environment
    • 메트릭당 최대 30개
  • 모든 메트릭은 Timestamp 포함

기능

  • CloudWatch Dashboard 생성
  • Custom Metrics 생성 가능
    • 예: RAM 사용량

1-2. CloudWatch Metric Streams

CloudWatch 메트릭을 거의 실시간으로 외부로 스트리밍

특징

  • 낮은 지연 시간
  • 스트리밍 대상
    • Kinesis Data Firehose
    • Datadog, Dynatrace, New Relic, Splunk, Sumo Logic 등
  • 특정 메트릭만 필터링 가능

구조

CloudWatch Metrics
 └─ Metric Streams
     └─ Kinesis Data Firehose
         ├─ Amazon S3
         ├─ Amazon Redshift
         ├─ Amazon OpenSearch
         └─ Athena

1-3. CloudWatch Logs

구성 요소

  • Log Group
    • 애플리케이션 단위
  • Log Stream
    • 인스턴스 / 컨테이너 / 파일 단위

주요 기능

  • 로그 보존 기간 설정
    • 1일 ~ 10년 / 영구 보존
  • 기본 암호화 적용
  • KMS 기반 사용자 지정 키 가능

로그 전달 대상

  • Amazon S3
  • Kinesis Data Streams
  • Kinesis Data Firehose
  • AWS Lambda
  • Amazon OpenSearch

1-4. CloudWatch Logs – 로그 수집 소스

  • SDK
  • CloudWatch Logs Agent
  • CloudWatch Unified Agent
  • Elastic Beanstalk
  • ECS (컨테이너)
  • AWS Lambda
  • VPC Flow Logs
  • API Gateway
  • CloudTrail (필터 기반)
  • Route 53 (DNS Query 로그)

1-5. CloudWatch Logs Insights

CloudWatch Logs에 저장된 로그를 쿼리 분석

특징

  • 전용 쿼리 언어 제공
  • AWS 서비스 로그 & JSON 로그 필드 자동 인식
  • 기능
    • 필드 선택
    • 조건 필터링
    • 집계
    • 정렬
    • 결과 제한
  • 여러 Log Group / 계정 조회 가능
  • 실시간 엔진 ❌ (쿼리 엔진)

활용 예

  • 특정 IP 검색
  • ERROR 로그 횟수 집계
  • 대시보드에 쿼리 결과 추가

1-6. CloudWatch Logs – S3 Export

특징

  • 로그가 최대 12시간 후 Export 가능
  • API: CreateExportTask
  • 실시간/준실시간 ❌

👉 실시간 처리는 Logs Subscription 사용


1-7. CloudWatch Logs Subscriptions

로그를 실시간/준실시간으로 외부로 전달

대상

  • Kinesis Data Streams
  • Kinesis Data Firehose
  • AWS Lambda

구조

CloudWatch Logs
 └─SubscriptionFilter
     ├─ Lambda (Real-time)
     ├─ Kinesis Data Streams
     └─ Kinesis Data Firehose
         └─ OpenSearch / S3

1-8. CloudWatch Logs Aggregation

Multi-Account · Multi-Region

AccountA (Region1)
 └─ CloudWatch Logs
     └─ SubscriptionFilter
         └─ Kinesis Data Firehose
             └─ S3

AccountB (Region2,3)
 └─ 동일 구조
  • 중앙 S3로 로그 집계 가능

2. Cross-Account Logs Subscription

개념

  • 다른 AWS 계정의 Kinesis로 로그 전송

필수 요소

  • Destination Access Policy
  • Cross-Account IAM Role
  • PutRecord 권한 허용

3. EC2 로그 수집 – 기본 원칙

  • EC2는 기본적으로 로그 전송 ❌
  • 반드시 Agent 설치 필요

사용 가능 위치

  • EC2
  • On-Premise 서버

4. CloudWatch Logs Agent vs Unified Agent

CloudWatch Logs Agent

  • 구형
  • 로그만 수집

CloudWatch Unified Agent

  • 로그 + 시스템 메트릭
  • RAM, 프로세스 등 수집
  • SSM Parameter Store 기반 중앙 설정

5. Unified Agent – 수집 메트릭

  • CPU (user, system, idle 등)
  • Disk (free, used, IO, IOPS)
  • RAM (free, used, cached)
  • Network
  • Processes
  • Swap Space

EC2 기본 메트릭은 고수준(CPU, Disk, Network)만 제공


1️-9. CloudWatch Alarms

개념

  • 메트릭 기반 알림 트리거

상태

  • OK
  • INSUFFICIENT_DATA
  • ALARM

설정 요소

  • Period (초 단위)
  • High Resolution Metrics
    • 10초 / 30초 / 60초 단위

1️-10. CloudWatch Alarm 대상

  • EC2
    • Stop / Terminate / Reboot / Recover
  • Auto Scaling Action
  • Amazon SNS 알림

6. Composite Alarms

여러 Alarm 상태를 조합

특징

  • AND / OR 조건
  • 알람 노이즈 감소
AlarmA (CPU)
AlarmB (IOPS)
 └─ Composite Alarm
     └─ SNS

7. EC2 Instance Recovery

Status Check

  • Instance Status (VM)
  • System Status (하드웨어)
  • EBS 상태

복구 특징

  • IP, 메타데이터, Placement Group 유지

8. Alarm – 추가 팁

  • Logs Metric Filter 기반 Alarm 가능
  • CLI로 강제 테스트
aws cloudwatch set-alarm-state \\
 --alarm-name"myalarm" \\
 --state-value ALARM \\
 --state-reason"testing"

9. Amazon EventBridge (구 CloudWatch Events)

기능

  • 스케줄 기반 (Cron)
  • 이벤트 기반 트리거

대상

  • Lambda
  • SQS
  • SNS
  • Step Functions
  • ECS / Batch

9-1. EventBridge Rules

이벤트 소스

  • EC2 상태 변경
  • CodeBuild 실패
  • S3 업로드
  • Trusted Advisor
  • CloudTrail API Call
  • Cron Schedule

구조

Event Source
 └─ EventBridge Rule
     └─ Target (Lambda / SNS / SQS /Step Functions 등)

9-2. EventBridge Event Bus

  • Default Event Bus
  • Partner Event Bus
  • Custom Event Bus
  • Cross-Account 접근 가능
  • 이벤트 아카이빙 & 재생

9-3. EventBridge Schema Registry

기능

  • 이벤트 자동 분석
  • 스키마 추론
  • 코드 자동 생성
  • 버전 관리

9-4. EventBridge Resource-based Policy

Event Bus 접근 제어

  • 계정/리전 단위 허용·차단
  • 조직 단위 중앙 이벤트 수집

1-11. CloudWatch Container Insights

대상

  • ECS
  • EKS
  • Kubernetes on EC2
  • Fargate

기능

  • 컨테이너 메트릭 & 로그 수집
  • Kubernetes는 Agent 컨테이너 사용

1-12. CloudWatch Lambda Insights

기능

  • Lambda 전용 모니터링
  • CPU Time
  • Memory
  • Disk / Network
  • Cold Start
  • Worker Shutdown

Lambda Layer 형태로 제공


1-13. CloudWatch Contributor Insights

목적

  • Top-N Contributor 분석

예시

  • 가장 많은 트래픽 IP
  • 오류를 가장 많이 발생시키는 URL

기반

  • CloudWatch Logs

1-14. CloudWatch Application Insights

특징

  • 애플리케이션 자동 대시보드
  • SageMaker 기반 분석
  • 지원 기술
    • EC2
    • Java, .NET, IIS
    • RDS, EBS, ELB, ASG
    • Lambda, SQS, DynamoDB, S3, ECS, EKS, SNS, API Gateway

결과

  • EventBridge
  • SSM OpsCenter

10. AWS CloudTrail

감사 · 거버넌스 · 컴플라이언스

특징

  • 기본 활성화
  • 모든 API 호출 기록
  • Console / SDK / CLI / AWS Service 포함
  • 로그 대상
    • CloudWatch Logs
    • S3

10-1. CloudTrail 이벤트 유형

Management Events

  • 기본 활성화
  • 리소스 설정 변경
  • Read / Write 분리 가능

Data Events

  • 기본 비활성화
  • S3 Object API
  • Lambda Invoke

Insights Events

  • 이상 징후 탐지

10-2. CloudTrail Insights

탐지 대상

  • 비정상 리소스 프로비저닝
  • 서비스 제한 초과
  • IAM 액션 폭증
  • 정기 작업 누락

흐름

CloudTrail
 └─ Insights 분석
     ├─ 콘솔 표시
     ├─ S3 저장
     └─ EventBridge 이벤트

10-3. CloudTrail 로그 보존

  • 기본 90일
  • 장기 보관:
CloudTrail
 └─ S3
     └─ Athena 분석

11. EventBridge + CloudTrail 활용

  • 특정 API 호출 감지
  • 예: DeleteTable
  • 자동 알림 / 자동화 대응 가능

12-1. AWS Config

리소스 설정 변경 & 컴플라이언스 추적

질문 예

  • SSH 0.0.0.0/0 열려 있는가?
  • S3 Public Access 있는가?
  • ALB 설정이 언제 바뀌었는가?

특징

  • 리전 단위 서비스
  • 멀티 리전·멀티 계정 집계 가능
  • S3 저장 → Athena 분석

12-2. AWS Config Rules

유형

  • AWS Managed Rule (75+)
  • Custom Rule (Lambda)

평가 방식

  • 설정 변경 시
  • 주기적 평가

제한

  • 차단 ❌ (감지만 가능)

12-3. Config Resource View

  • 컴플라이언스 이력
  • 설정 변경 타임라인
  • 관련 CloudTrail API 호출

12-4. Config Remediation

자동 조치

  • SSM Automation Document
  • Lambda 호출 가능
  • 재시도 설정 가능

12-5. Config Notifications

  • EventBridge 연계
  • SNS / SQS / Lambda
  • 모든 변경 이벤트 또는 필터링 가능

13. CloudWatch vs CloudTrail vs Config

CloudWatch

  • 성능 모니터링
  • 로그
  • 알림

CloudTrail

  • API 호출 기록
  • 감사

AWS Config

  • 설정 변경
  • 컴플라이언스

14. ELB 예시 비교

CloudWatch

  • 트래픽
  • 에러율
  • 성능 대시보드

Config

  • SG 변경 추적
  • SSL 설정 컴플라이언스

CloudTrail

  • 누가 ELB 설정 변경했는지 추적