Среднее время безотказной работы EC2? - PullRequest
13 голосов
/ 30 декабря 2008

Любопытно, что 99,95% безотказной работы действительно означает; Это действительно собирается идти вниз 7 минут в месяц? Пожалуйста, опубликуйте ваши самые длинные / средние показатели безотказной работы на EC2, спасибо.

Ответы [ 8 ]

14 голосов
/ 30 декабря 2008

Обычно время безотказной работы рассчитывается ежегодно. Таким образом, если у вас есть Соглашение об уровне обслуживания на 99,95%, это означает:

365 * 0.0005 = 0.1825 days or 4.38 hours

Если в течение года службы произошел сбой, и ваша система не работает более чем на этом, вы несете ответственность за компенсацию.

По вашему вопросу у меня есть сервер, работающий без остановки в EC2 в течение 3 месяцев. Я бы сказал, что время их работы хорошее, но если у вас есть критически важное приложение, вам обязательно нужно иметь решение для отработки отказа. Хорошее время работы только означает, что они смогут быстро реагировать на сбой. Даже время безотказной работы 99,9999% не сможет спасти вас, если вы не готовы к отключению.

11 голосов
/ 04 февраля 2009

Внимательно прочитайте SLA (http://aws.amazon.com/ec2-sla/), они считают «Регион недоступен» только как время простоя, а более того, они считают его простоем, если регион не работает в течение 5 минут подряд.

«Годовой процент времени безотказной работы» рассчитывается путем вычитания из 100% процента 5-минутных периодов в течение Сервисного года, в котором Amazon EC2 находился в состоянии «Регион недоступен».

По моим подсчетам, это означает, что любое время простоя менее 4 минут не учитывается. Кроме того, если они нарушают SLA, они платят только за% 10 от месяца, в котором у вас был самый большой счет простоя. Так что, если бы они не работали в течение всего января, а ваш счет составлял 100 долларов, они применили бы кредит 10 долларов на ваш счет.

Мне было бы трудно убедить моего босса, что это серьезный продукт с таким SLA.

9 голосов
/ 25 октября 2009

SLA бесполезны. Они только измеряют, какой риск компания готова взять на себя, и не имеют никакого отношения к фактическому времени безотказной работы. Я видел SLA с большими штрафами, которые предлагались, когда компания знала, что не может выполнить SLA для продажи.

У меня есть один клиент с 400+ днями безотказной работы EC2, а другой - с 300+ днями, измеряемый веб-пульсом, это, безусловно, самая надежная служба, с которой я работал.

7 голосов
/ 26 февраля 2009

Для моего единственного экземпляра, работающего в зоне доступности США-Восток, 9 месяцев, 0 простоев.

5 голосов
/ 16 января 2009

С тех пор, как Amazon переключился на предоставление SLA, у меня никогда не было случая, чтобы я отказался от него. Когда в прошлом у меня отключались экземпляры, Amazon всегда отправлял сообщение, информирующее меня о том, что экземпляр ухудшился до того, как он фактически исчез, поэтому у меня было время запустить новый экземпляр.

Предыдущий ответ дает хорошее замечание; Модель обслуживания EC2 требует, чтобы вы писали свои приложения для обработки отработки отказа на новом сервере, если вы не готовы к длительному простоям.

4 голосов
/ 20 января 2009
conrad@papa ~ $ uptime
 04:42:36 up 495 days,  8:51,  8 users,  load average: 0.02, 0.02, 0.00
3 голосов
/ 18 января 2009

Извлечение Панели мониторинга работоспособности службы AWS поможет вам получить представление о текущих или прошлых проблемах. По моему опыту, время безотказной работы AWS лучше, чем у большинства "традиционных" вариантов хостинга (даже у полномасштабной избыточной настройки RackSpace ...).

Тем не менее, просто использовать AWS для безотказной работы - все равно что купить машину для связки ключей (хорошо, почти ..;)). В архитектуре, использующей AWS, большое преимущество заключается в масштабировании (без первоначальных затрат).

2 голосов
/ 02 марта 2012

SLA ... Гарантированное время работы ...

Это все очень хорошие слоганы. Но если серверы недоступны в течение часа (1 марта 2012 г., в регионе ЕС) и клиенты начинают звонить, то вам не поможет то, что они по-прежнему будут работать 300 дней.

И когда молния ударила по 1 из 3 их центров обработки данных в ЕС, мы все обнаружили, что у них нет внешних резервов, и тот факт, что у них есть 3 центра обработки данных, ничего не значит.

Нужно любить фразу «ухудшенное качество», что на самом деле означает: «скрестите пальцы и молитесь, чтобы ваши данные все еще были доступны после прохождения катастрофы».

Я все еще пытаюсь найти какие-либо официальные / неофициальные статистические данные о процентах доступности всех их центров обработки данных.

Пока не повезло ...

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...