콘텐츠로 이동

⚖️ AWS Auto Scaling 완벽 가이드

1️⃣ AWS Auto Scaling 이란?

AWS Auto Scaling은 트래픽이나 부하(Load)에 따라 EC2 인스턴스의 개수를 자동으로 늘리거나 줄이는 서비스입니다.

👉 쉽게 말해, “손님이 많으면 서버를 자동으로 늘리고, 손님이 적으면 줄여서 비용을 절약하는 기능” 이에요.

2️⃣ Auto Scaling의 핵심 개념

Scaling Out 🚀 → 트래픽이 많아질 때 서버 개수 증가

Scaling In 📉 → 트래픽이 줄어들면 서버 개수 감소

Scaling Policy ⚙️ → 어떤 조건에서 서버를 늘리거나 줄일지 정의

Auto Scaling Group (ASG) 👥 → Auto Scaling이 관리하는 서버 그룹

3️⃣ Auto Scaling 아키텍처 개념도

graph TD
    User[사용자] --> ALB[Application Load Balancer]
    ALB --> ASG[Auto Scaling Group]
    ASG --> EC2_1[EC2 인스턴스 #1]
    ASG --> EC2_2[EC2 인스턴스 #2]
    ASG --> EC2_3[EC2 인스턴스 #3]

    subgraph Monitoring
        CW[Amazon CloudWatch]
    end
    CW --> ASG

📝 설명

사용자는 로드 밸런서(ALB) 를 통해 접속

로드 밸런서는 트래픽을 여러 EC2 인스턴스로 분산

Auto Scaling Group은 CloudWatch 모니터링 데이터를 기반으로

서버가 부족하면 새로운 EC2 자동 생성

서버가 과하면 불필요한 EC2 종료

4️⃣ Auto Scaling의 장점

📈 확장성 (Scalability) → 사용량에 맞춰 서버 자동 확장

💰 비용 효율성 (Cost Efficiency) → 필요할 때만 서버 사용, 비용 절감

🛡️ 가용성 (High Availability) → 장애 발생 시 새 인스턴스 자동 생성

⚡ 운영 자동화 (Automation) → 관리 부담 최소화

5️⃣ Auto Scaling 동작 흐름 (Step by Step)

CloudWatch가 CPU 사용률 80% 초과 감지

Auto Scaling Group이 새로운 EC2 인스턴스를 추가 생성 (Scaling Out)

트래픽이 줄어 CPU 사용률이 30% 이하로 내려감

Auto Scaling Group이 불필요한 EC2 인스턴스를 종료 (Scaling In)

6️⃣ Auto Scaling 실습 포인트

EC2 Launch Template 생성 (서버 설정값)

Auto Scaling Group 생성 (최소/최대/원하는 서버 개수 설정)

CloudWatch 알람 연결 (예: CPU 70% 이상 → 서버 추가)

로드 밸런서와 연결 (사용자 트래픽 자동 분산)

✅ 정리

AWS Auto Scaling은 서버 개수를 자동으로 늘리고 줄여주는 서비스입니다.

손님이 몰리면 서버 늘리고 🚀

한가하면 서버 줄여서 비용 절감 💰

장애가 나도 자동 복구 🛡️

  • 참고 링크 : https://velog.io/@yjshin/AWS-Auto-Scaling

👉 스타트업부터 대기업까지 모든 규모의 웹 서비스 운영에 필수적인 기능입니다.