Сбой Дата-центра Amazon

Дата-центр Amazon EC2 упал, отправив в даун сотни сайтов и сервисов

21 апреля 2011 года в 11:41 (MSK) произошел сбой в работе "облачного" сервиса Amazon EC2, сдающего в аренду вычислительные мощности сторонним компаниям.

Дата-центр Amazon EC2 упал

Данный сбой привел к временному коллапсу ряда популярных сайтов и сервисов, например, Netflix, Zynga, Foursquare, Quora, Reddit и многих других. Посмотреть список сайтов #ec2disabled.

Причиной стала ошибка в сетевых настройках кластера Amazon Elastic Block Store (“EBS”), спровоцировавшие перегрузку маршрутизаторов.

В сбойном кластере EBS 0,07% данных оказались безвозвратно утеряны, учитывая популярность сервиса Amazon S3 можно предположить что это были сотни гигабайт. Восстановить их можно было только из бэкапа. Клиенты начали получать доступ к EC2 через 12 часов после инцидента, однако на ликвидацию всех последствий ушло около четырех дней.

Детали случившегося можно почитать по ссылкам:

https://habrahabr.ru/post/118001/
https://habrahabr.ru/post/118434/
https://aws.amazon.com/ru/message/65648/