![[박준석] TV스페셜](https://img.wownet.co.kr/banner/202508/2025082621c6d0c271f84886a953aee25d7ba0c0.jpg)




아마존닷컴(NASDAQ:AMZN)의 클라우드 서비스 부문인 아마존웹서비스(AWS)가 미국 최대 데이터 허브인 US-East-1(버지니아 북부) 지역에서 광범위한 운영 장애를 확인했다. 이번 장애로 여러 클라우드 서비스에서 오류율이 증가하고 지연 현상이 발생했다.
AWS 엔지니어들은 태평양 시간 12시 11분부터 EC2, 다이나모DB, 람다, RDS, ECS, 글루 등 다양한 서비스에서 발생한 높은 오류율과 지연 현상을 조사하기 시작했다.
약 1시간 후 AWS는 다이나모DB API 엔드포인트의 DNS 해석 실패가 문제의 원인이라고 확인했다. 이는 IAM 업데이트와 다이나모DB 글로벌 테이블과 같은 종속 시스템과 글로벌 서비스에 영향을 미쳤다.
태평양 시간 2시 22분, AWS는 초기 문제 해결 조치를 적용했으며 '초기 복구 징후'가 나타나기 시작했다. AWS는 서비스 백로그를 해소하는 동안 고객들에게 실패한 요청을 재시도할 것을 권고했다.
3시 35분, AWS는 DNS 문제를 완전히 해결했으며 대부분의 서비스 운영이 정상화됐다고 발표했다. 다만 일부 가용 영역에서는 용량 관련 오류로 인해 새로운 EC2 인스턴스 실행에 어려움이 있었다.
4시부터 6시 사이에 AWS는 영향을 받은 모든 영역에서 점진적으로 완전한 기능을 복구했다. 엔지니어들은 새로운 EC2 인스턴스 실행을 재개하고, 이벤트브리지와 클라우드트레일의 백로그를 처리했으며, 람다 SQS 이벤트 매핑을 정상화했다.
AWS는 고객들에게 특정 가용 영역을 지정하지 말고 새로운 EC2 인스턴스를 실행하여 AWS가 자동으로 사용 가능한 용량을 선택할 수 있도록 권고했다. 태평양 시간 5시 48분, AWS는 '대부분의 요청이 현재 성공적으로 처리되고 있다'며 꾸준한 진전을 확인했다.
이번 서비스 중단으로 70개 이상의 AWS 제품이 영향을 받았으며, 전 세계적으로 여러 주요 웹사이트와 애플리케이션이 중단됐다. AWS는 이번 문제가 보안 관련이 아닌 운영상의 문제라고 밝혔으며, 엔지니어팀이 '복구 가속화를 위해 여러 병렬 경로에서 작업'했다고 설명했다.
다운디텍터에 따르면 이번 장애로 아마존, 디즈니(NYSE:DIS)의 디즈니플러스, 리프트(NASDAQ:LYFT), 맥도날드(NYSE:MCD) 앱, 뉴욕타임스(NYSE:NYT), 레딧(NYSE:RDDT), 링, 로빈후드(NASDAQ:HOOD), 스냅(NYSE:SNAP)의 스냅챗, T모바일(NASDAQ:TMUS), 유나이티드항공(NASDAQ:UAL), 벤모, 버라이즌(NYSE:VZ) 등이 일시적으로 접속이 중단됐다.
영국 정부 웹사이트인 Gov.uk와 국세청 사이트도 오프라인 상태가 됐다.
로이즈 뱅킹 그룹도 서비스 중단을 확인했다.
유나이티드항공과 델타항공(NYSE:DAL) 승객들도 체크인이나 예약 접속에 어려움을 겪었다고 보고했다.
로블록스(NYSE:RBLX), 포트나이트, 코인베이스(NASDAQ:COIN), 캔바, 퍼플렉시티 AI 등 클라우드 기반 플랫폼들도 서비스 중단을 보고했다.
주가 동향: 아마존 주식은 월요일 마지막 거래에서 0.69% 상승한 214.47달러를 기록했다.