Какой дистрибутив я использую для симуляции "случайных" сбоев программы? - PullRequest
1 голос
/ 23 мая 2011

Я хочу проверить устойчивость распределенной программы к случайным сбоям каждого узла . Мне нужно использовать какое-то случайное распределение, которое контролировало бы частоту сбоя каждого узла - например, это может быть нормальное распределение со средним значением 2 часа или что-то еще.

Как мне выбрать этот закон распределения и как мне решить, какие значения присваивать параметрам распределения?

Ответы [ 2 ]

2 голосов
/ 24 мая 2011

Как отмечает Рош Оксиморон, было бы странно, если бы время прибытия аварий не было чем-то независимым. Тем не менее, это заставляет меня думать, что правильный способ моделирования этого поведения - это процесс Пуассона. Это означает, что время вашего прибытия будет основано на экспоненциальном распределении. Параметр скорости распределения - это то, что вы, вероятно, захотите придумать эмпирически, посмотрев данные о текущей частоте сбоев.

2 голосов
/ 23 мая 2011

Было бы очень странно, если бы поведение программы зависело от конкретного времени сбоя.У вас может быть разный результат в зависимости от того, что делает программа, когда происходит сбой, но разные кодовые точки появляются в случайное время, поэтому у вас есть небольшой шанс слишком часто ударить по чему-либо.Просто избегайте фиксированных интервалов, чтобы избежать совпадения с фиксированными таймерами, гауссиан со средним значением в 2 часа, а в форме от 1 до 3 часов, вероятно, все еще будет, это не должно иметь большого значения.Я лично сделал бы это равномерно, чтобы убедиться, что у меня есть равные шансы на срабатывание фиксированного таймера или чего-то еще.

...