📊 AWS CloudWatch 정리¶
1️⃣ AWS CloudWatch란?¶
Amazon CloudWatch 는 AWS 리소스(EC2, RDS, Lambda 등)와 애플리케이션을 모니터링 및 로깅할 수 있는 서비스입니다.
👉 쉽게 말해, “AWS 서비스들의 건강 상태를 실시간으로 지켜보고, 문제가 생기면 알려주는 감시자” 입니다.¶
2️⃣ CloudWatch의 주요 기능¶
📈 메트릭(Metrics)¶
CPU, 메모리, 네트워크, 디스크 사용량 등 지표 수집
📋 로그(Log) 수집 및 관리¶
애플리케이션 로그, 시스템 로그를 중앙에서 관리
🔔 알람(Alarms)¶
특정 조건 발생 시 알림 (예: CPU > 80% → Slack/Email로 알람)
📊 대시보드(Dashboards)¶
지표와 로그를 시각적으로 모니터링
⚡ 이벤트(Events)¶
AWS 리소스에서 발생하는 이벤트를 감지하고 자동으로 대응 (예: Auto Scaling 트리거)
3️⃣ CloudWatch 아키텍처 개념도¶
graph TD
subgraph AWS Services
EC2[EC2 Instances]
RDS[RDS Database]
Lambda[AWS Lambda]
S3[S3 Bucket]
end
EC2 --> CW[CloudWatch]
RDS --> CW
Lambda --> CW
S3 --> CW
CW --> Metrics[Metrics & Logs]
CW --> Alarm[Alarms]
CW --> Dashboard[Dashboards]
Alarm --> SNS[Amazon SNS Notification]
SNS --> User[👩 사용자/운영자]
4️⃣ CloudWatch 사용 예시¶
EC2 CPU 사용률이 80% 초과 시 알람 전송
RDS 스토리지가 가득 차기 전 경고 발생
Lambda 함수 오류율이 일정 기준 이상일 때 Slack/이메일 알림
S3 버킷 접근 로그를 중앙 집중형 분석
Auto Scaling과 연동 → 트래픽 급증 시 서버 자동 확장
5️⃣ 현업에서의 활용¶
현업에서는 CloudWatch를 다음과 같이 적극적으로 활용합니다.
🛠 운영 모니터링¶
서버 상태, DB 성능, API 응답 시간 등을 실시간 모니터링
🔔 알림 자동화¶
CloudWatch Alarms + SNS → 장애 발생 시 Slack, Teams, PagerDuty로 알림 전송
⚡ 자동 대응¶
CloudWatch Events → 특정 조건 충족 시 Lambda 실행
예) CPU 90% 이상 → Auto Scaling Group에 새 EC2 추가
📑 비용 관리¶
사용량/비용 관련 메트릭 추적 → AWS Budgets와 함께 활용
🧑💻 DevOps / SRE 필수 도구¶
CI/CD 파이프라인 로그 수집
보안 모니터링(AWS GuardDuty, Config와 함께)
✅ 정리¶
AWS CloudWatch는
모니터링 (Metrics & Logs), 알림 (Alarms & SNS), 자동화 (Events & Lambda 연동) 등을 통해 운영 안정성과 가용성을 높여주는 핵심 서비스입니다.
👉 한마디로, “AWS의 CCTV + 알람 시스템” 이라고 이해하면 가장 쉽습니다.¶
- 참고 블로그 링크 : https://velog.io/@yjshin/AWS-AWS-CloudWatch-Amazon-CloudWatch