아마존닷컴(NASDAQ:AMZN)의 클라우드 부문 AWS가 월요일 1000개 이상의 웹사이트와 서비스에 영향을 미친 대규모 장애 사태에 대해 사과하고 상세 설명을 내놓았다.
이번 장애로 스냅챗(NYSE:SNAP), 디즈니플러스(NYSE:DIS), 레딧(NYSE:RDDT), 로이즈뱅크(NYSE:LYG) 등 다수의 웹사이트와 서비스가 영향을 받았다.
AWS는 목요일 상세 설명을 통해 이번 장애가 회사의 가장 중요한 시스템 중 하나에서 발생한 희귀 소프트웨어 버그로 인한 연쇄 장애였다고 밝혔다. 문제는 AWS의 최대 데이터센터 클러스터인 US-EAST-1이 위치한 북버지니아 지역에서 발생했다.
AWS는 "이번 사태로 고객들이 겪은 불편에 대해 사과드린다...많은 고객들이 상당한 영향을 받은 것을 알고 있다"고 밝혔다.
AWS에 따르면 내부 시스템의 '오류가 있는 자동화' - 기록 업데이트를 위해 서로 경쟁하는 두 개의 독립 프로그램 - 가 DynamoDB 데이터베이스 서비스의 주요 네트워크 항목을 삭제했고, 이로 인해 도미노 효과가 발생해 다른 많은 AWS 도구들이 일시적으로 작동하지 않게 됐다.
로블록스(NYSE:RBLX)와 포트나이트 같은 플랫폼은 몇 시간 만에 복구됐지만, 로이즈뱅크, 미국 결제앱 벤모, 소셜미디어 사이트 레딧 등은 장시간 서비스가 중단됐다.
AWS는 "이번 사태를 통해 배우고 가용성을 더욱 개선하기 위해 최선을 다할 것"이라고 밝혔다.
AWS는 또한 문제가 된 자동화 시스템을 전 세계적으로 중단했으며, 버그를 수정한 후에 다시 온라인으로 복구할 예정이라고 밝혔다.
이번 사태로 빅테크 기업의 권력 집중과 단일 기업의 인프라가 인터넷의 상당 부분을 지원하는 것에 대한 잠재적 위험, 그리고 대안의 필요성에 대한 논의가 촉발됐다.
엘리자베스 워런 상원의원(민주당-매사추세츠)은 이번 사태 이후 빅테크 기업 해체를 촉구했다. 이번 장애로 단일 클라우드 제공업체에 대한 의존도와 이러한 의존성에 따른 잠재적 위험에 대한 우려가 제기됐다.
한편 일론 머스크는 X가 AWS와 독립적으로 운영되며 완전히 암호화되어 있다고 발표했다.
벤징가의 자체 엣지 랭킹에 따르면 아마존은 모멘텀 등급 65.94%, 성장 등급 92.76%를 기록하고 있다.