AWS снова вышла из строя и вывела из строя целый ряд веб-сайтов — теперь мы знаем, почему

Пострадали Twitch, PSN, Hulu и другие — вот все, что нам известно

Обновить

Сейчас все системы стали зелеными, по крайней мере, согласно приборной панели AWS, AWS добавила немного контекста ко второму крупному отключению за несколько недель. Регионы US-WEST-1 и WEST-2 были затронуты идентичными проблемами. Мы позволим им объяснить это: 

«Между 7:14 AM PST и 7:59 AM PST клиенты испытывали повышенную потерю сетевых пакетов, что повлияло на соединение с некоторыми интернет-направлениями. Трафик внутри регионов AWS, между регионами AWS и в другие пункты назначения в Интернете не пострадал. 

«Проблема была вызвана перегрузкой сети между частями магистрали AWS и некоторыми интернет-провайдерами, которая была вызвана инженерной обработкой трафика AWS, выполненной в ответ на перегрузку за пределами нашей сети. 

«Эта инженерная обработка трафика неправильно направила больше трафика, чем ожидалось, в части магистрали AWS, что повлияло на соединение с некоторыми пунктами назначения в Интернете. Проблема устранена, и мы не ожидаем ее повторения.»

Похоже, что проблемы начались с инженерии трафика AWS, которая видела сетевой трафик, но затем сделала неверный выбор и переместила слишком большую его часть в AWS Backbone, что помешало подключению к Интернету некоторых из ваших любимых направлений.

К настоящему времени большинство ваших систем, поддерживаемых AWS, должны работать без сбоев, но мы все еще видим несколько сообщений в Twitter о периодических и длительных сбоях (подключение гарнитуры Oculus VR Headset, кто-нибудь?). Возможно, к утру все будет полностью устранено.

Ну и дикая же это была поездка, не так ли?

Если вы только что к нам присоединились — в двух крупных регионах AWS, US-WEST-1 и US-WEST 2, возникли проблемы с «подключением к интернету».

Это повлияло на целый ряд сайтов, работающих на сервисах AWS: проблемы возникли у Hulu, PlayStation Network и даже Amazon.com.

AWS утверждает, что проблемы уже устранены, так что будем надеяться, что на этом наши обновления закончатся — спасибо, что читаете Pro!

И вот оно — проблема с регионом Орегон тоже решена.

«Мы устранили проблему, влияющую на подключение к Интернету в регионе US-WEST-2», — говорится в сообщении AWS. «Подключение внутри региона не было затронуто этим событием. Проблема была устранена, и сервис работает нормально.»

Большое обновление — AWS сообщает, что проблема с регионом US-WEST-1 в Северной Калифорнии теперь устранена!

«Мы устранили проблему, влияющую на подключение к Интернету в регионе US-WEST-1», — сообщается на странице состояния AWS. «Подключение внутри региона не было затронуто этим событием. Проблема была устранена, и сервис работает нормально.»

Регион US-WEST-2 в Орегоне все еще находится под расследованием, но сообщения DownDetector быстро падают, так что пальцы скрещены, что и он скоро будет решен…

Downdetector outage reports on AWS services

(Источник: DownDetector)

На DownDetector начинают поступать сообщения об отключениях — может ли ситуация восстановиться и вернуться в нормальное русло?

AWS утверждает, что, возможно, проблема решена — последнее обновление на AWS Status Dashboard отмечает:

«Мы определили основную причину неполадок с интернет-соединением в регионе US-WEST-1 и предприняли шаги для восстановления соединения. В последние несколько минут мы наблюдаем некоторое улучшение интернет-соединения, но продолжаем работать над полным восстановлением. »

По всей видимости, проблемы затронули оба региона AWS US-WEST-1 и US-WEST-2 — два огромных региона для компании, где проживает огромное количество клиентов.

Возможно, именно поэтому большое количество сайтов и инструментов в настоящее время не работают — DownDetector показывает, что другие сервисы, такие как Zoom, Okta, Salesforce и Crunchyroll, также пострадали.

Не совсем «самое счастливое место на Земле» в настоящее время, похоже. …

Официальная панель состояния сервиса AWS пока не показывает никаких серьезных проблем, но сам сайт загружается очень медленно, что, возможно, указывает на то, что что-то идет не так.

В настоящее время отображаются только проблемы, связанные с «подключением AWS к Интернету» в регионах Северной Калифорнии и Орегона — части региона AWS US-WEST-1.

AWS заявляет, что «расследует проблемы с подключением к Интернету в регионе US-WEST-1. »

Downdetector services hit by AWS outage

(Источник: Future / DownDetector)

Похоже, особенно пострадали сервисы видеоигр: проблемы наблюдаются в PlayStation Network, Twitch, League of Legends, Valorant, Apex Legends и Halo.

Как уже упоминалось, на DownDetector поступили тысячи жалоб: пользователи из США, Европы и Азии сообщают о проблемах с AWS.

Это привело к тому, что другие популярные веб-сайты, размещенные на сервисах AWS, также оказались в автономном режиме.

По данным DownDetector, проблемы наблюдались у таких компаний, как Hulu, Intuit QuickBooks и DoorDash, а также у Amazon. com

Это случилось снова — мы видим многочисленные сообщения о сбоях в работе AWS, которые вызвали проблемы на ряде известных сайтов.

Оставьте комментарий