1️⃣ AWS 장애로 서비스가 멈췄나요? 현실적인 보상 방안을 알려드립니다.
갑작스러운 AWS 장애로 웹사이트가 마비되고 고객 문의가 폭주하는 상황, 모든 클라우드 서비스 운영자가 겪을 수 있는 악몽입니다. 이 순간 가장 먼저 드는 생각은 '이 막대한 손실을 AWS에 청구할 수 있을까?'일 것입니다. 하지만 결론부터 말하자면, 우리가 기대하는 방식의 현금 보상은 현실적으로 불가능합니다.
2️⃣ ✔ 핵심 요약: 현금 보상은 없습니다. '서비스 크레딧'이 유일한 보상책입니다.
AWS는 장애로 인한 기업의 직접적인 사업 손실(매출 감소, 기회비용, 브랜드 이미지 하락 등)을 현금으로 보상하지 않습니다. 이는 AWS 고객 계약서에 명시된 내용으로, 간접적 또는 결과적 손해에 대한 책임을 지지 않는다는 조항이 포함되어 있습니다.
유일하게 공식적으로 제공되는 보상책은 '서비스 크레딧(Service Credits)'입니다. 이는 SLA(Service Level Agreement, 서비스 수준 계약)에서 보장하는 월간 가용성 목표(예: 99.99%)를 달성하지 못했을 경우, 해당 월의 서비스 요금 일부를 향후 사용할 수 있는 크레딧으로 돌려주는 제도입니다. 가장 중요한 점은, 이 크레딧조차 기업이 직접 증빙 자료를 갖춰 기간 내에 신청해야만 받을 수 있다는 것입니다. 가만히 있으면 아무것도 보상받지 못합니다.
3️⃣ 왜 현금 보상은 불가능한가? (공유 책임 모델과 SLA의 본질)
AWS가 직접적인 손실 보상을 하지 않는 이유는 '공유 책임 모델(Shared Responsibility Model)'과 클라우드 산업의 표준적인 법적 책임 한계에 근거합니다.
- 공유 책임 모델: AWS는 데이터 센터, 서버, 네트워크 등 인프라의 보안과 운영('클라우드의 보안')을 책임집니다. 하지만 고객은 해당 인프라 위에서 실행되는 애플리케이션, 데이터, 접근 관리 등('클라우드에서의 보안')을 책임져야 합니다. 장애의 원인이 고객의 아키텍처 설계나 설정 실수에 있다면 AWS의 책임이 아닙니다.
- SLA의 본질: SLA는 서비스의 '가용성'을 보장하는 계약이지, 고객 비즈니스의 '성과'를 보장하는 계약이 아닙니다. AWS는 수백만 고객의 비즈니스 모델과 잠재적 손실 규모를 일일이 파악하고 보상할 수 없으므로, 책임을 서비스 요금의 일부를 환불해주는 수준으로 제한하는 것입니다. 이는 대부분의 대형 클라우드 제공업체가 채택하는 표준 방식입니다.
4️⃣ 단계별 해결 가이드: '서비스 크레딧' 신청, 이렇게 해야 받습니다.
최소한의 권리인 서비스 크레딧이라도 확보하려면 신속하고 정확한 절차를 밟아야 합니다. 장애 발생 직후부터 신청까지의 핵심 단계를 반드시 숙지하세요.
Step 1: 장애 발생 즉시 모든 증거를 수집하라
'나중에'는 없습니다. 실시간 증거가 협상의 핵심입니다. 장애를 인지한 시점부터 AWS Health Dashboard 상태 변화, CloudWatch 메트릭(오류율, 지연 시간 등), 내부 모니터링 시스템의 로그, 고객 불만 접수 시간 등 모든 기록을 타임스탬프와 함께 확보해야 합니다. 스크린샷, 로그 파일 등 형태는 무엇이든 좋습니다.
Step 2: 내가 사용하는 서비스의 SLA 문서를 확인하라
모든 AWS 서비스의 SLA는 다릅니다. EC2, S3, RDS 등 내가 사용하는 핵심 서비스의 공식 SLA 문서를 직접 찾아 월간 가용성 임계값(예: 99.99%, 99.95%)과 장애 시간에 따른 크레딧 지급 비율(예: 10%, 30%, 100%)을 정확히 파악해야 합니다.
Step 3: AWS Support에 공식 케이스를 제출하라
AWS Management Console에 로그인한 후, 'Support Center(지원 센터)'로 이동하여 새로운 케이스를 생성합니다. 이때, 케이스 유형은 반드시 'Account and billing support(계정 및 결제 지원)'으로 선택하고, 제목에 'SLA Credit Request'를 명시해야 합니다. 본문에는 다음 내용을 논리적으로 기재해야 합니다.
- 장애 발생 및 종료 시간 (UTC 기준)
- 영향을 받은 서비스 및 리전 (예: EC2, ap-northeast-2)
- 영향을 받은 리소스 ID (예: 인스턴스 ID, S3 버킷 이름)
- SLA 위반 근거 (수집한 증거 자료 첨부)
- SLA 문서에 기반한 예상 크레딧 요청
Step 4: 크레딧 적용 여부를 확인하라
케이스가 승인되면, 일반적으로 다음 달 AWS 청구서에서 요청한 서비스 크레딧이 자동으로 차감되어 적용됩니다. 이것이 현금이 아닌, 향후 AWS 서비스 이용 요금을 할인해주는 방식이라는 점을 다시 한번 인지해야 합니다.
5️⃣ 자주 묻는 질문 (FAQ & Troubleshooting)
Q1: 서비스 크레딧은 얼마나 받을 수 있나요?
장애 시간에 비례하며, 일반적으로 해당 월 서비스 요금의 10%에서 최대 100%까지 받을 수 있습니다. 예를 들어, EC2의 경우 월 가용성이 99.0% 이상 99.99% 미만이면 10%, 95.0% 이상 99.0% 미만이면 30%의 크레딧을 제공합니다.
Q2: 보상 신청 기한이 있나요?
매우 중요합니다. 일반적으로 장애가 발생한 월의 다음 결제 주기가 끝나기 전까지, 즉 장애 발생 후 약 1~2개월 내에 신청해야 합니다. 이 기한을 놓치면 크레딧을 받을 권리가 완전히 소멸되므로 무엇보다 신속한 대응이 필요합니다.
Q3: 저희 회사 코드 오류로 장애가 나도 보상되나요?
절대 불가능합니다. SLA 크레딧은 AWS 인프라 자체의 문제임이 명확할 때만 해당됩니다. 애플리케이션 코드 버그, 트래픽 예측 실패로 인한 용량 부족, 보안 그룹 설정 오류 등 고객 책임 영역에서 발생한 장애는 보상 대상이 아닙니다.
6️⃣ 결론: 보상 청구보다 중요한 것은 '장애 예방'입니다.
AWS 장애는 피할 수 없는 현실입니다. 서비스 크레딧은 최소한의 보상일 뿐, 기업의 실질적인 손실을 메우기엔 턱없이 부족합니다. 따라서 AWS에 책임을 묻는 것보다 더 중요한 것은 장애를 '관리 가능한 리스크'로 전환하는 것입니다.
지금 바로 Multi-AZ, Multi-Region 아키텍처 도입을 검토하고, 비즈니스 연속성 계획(BCP)과 재해 복구(DR) 전략을 수립하세요. 클라우드 의존도가 높다면, 제3자 공급업체 장애로 인한 손실을 보장하는 사이버 보험 가입도 고려해볼 수 있습니다. 장애는 또다시 발생할 것입니다. 그때를 대비하는 것이야말로 최고의 보상 전략입니다.
0 댓글