Основные причины сбоя сервера приложений - PullRequest
2 голосов
/ 03 января 2011

Каковы наиболее вероятные причины сбоя сервера приложений?

Например: «нехватка места на диске» более вероятна, чем «2 диска в установочной матрице RAID 4»одновременно ".

Моя конкретная среда - Java, поэтому ответы на конкретные вопросы приветствуются, но не обязательны.

РЕДАКТИРОВАТЬ просто чтобы уточнить, я ищу время простоясвязанные с этим сбои (нехватка памяти - хороший пример), а не единовременные проблемы (например, временная проблема с сетью).

Ответы [ 5 ]

2 голосов
/ 25 марта 2011

Эдвин прав - вам нужен мониторинг, чтобы понять, в чем проблема. Или лучше - поймите, в чем проблема, и предотвратите простои.

Вы должны не только отслеживать потребление ресурсов, но и спрос. Разница между ними показывает, правильно ли вы настроили свой сервер.

Существует множество инструментов с открытым исходным кодом, таких как nagios, CollectD и т. Д., Которые могут предоставить вам специфические данные сервера - это только мониторинг, а не предотвращение. Librato Silverline (раскрытие: я там работаю) позволяет отслеживать отдельные процессы, а затем регулировать ресурсы, которые они используют, помещая их в контейнеры приложений, для которых вы определяете политики ресурсов. Если ваш сервер имеет 8 ядер или менее, вы можете использовать его бесплатно.

2 голосов
/ 03 января 2011

Если вы пытаетесь сохранить сервер приложений включенным, начните его мониторинг. Nagios, Big Sister и другие инструменты мониторинга сети могут быть очень полезны.

Просмотр доступности / использования памяти, доступности / использования диска, доступности / использования процессора и т. Д.

Самая распространенная причина, по которой сервер отключается, редко бывает одна и та же. Кто-то «исправляет» последнюю наиболее распространенную причину, и рождается новая наиболее распространенная причина.

1 голос
/ 03 января 2011

Во-первых, обычно это происходит из-за утечек памяти, проблем с дисковым пространством, бесконечных циклов, приводящих к сгоранию процессора.

Как только вы наблюдаете за этими проблемами и устанавливаете правильные механизмы ведения журналов и предупреждений, они включают вас в метаданные ... и взрывная обработка ошибок становится возможной причиной полной блокировки: ошибка (или, более вероятно, две в несчастливой комбинации). ) происходит, но когда обработчик пытается записать в файлы журнала или отправить предупреждение (по почте или что-то), он получает другую ошибку, которую он пытается обработать, записав в файл журнала или отправив предупреждение или ..., и это продолжается до один из ресурсов выдан: это может привести к чрезмерной загрузке сервера, проблемам с памятью, заполнению дискового пространства, блокировке сетевого трафика, что означает, что удаленный пользователь не сможет устранить проблему и т. д.

1 голос
/ 03 января 2011

Все виды вещей могут привести к сбою сервера, начиная от перегруженного оборудования (например, сбои диска) до неисправного кода (утечка памяти, приводящая к исключению нехватки памяти, сбой сети, который был переброшен как исключение времени выполнения и никогда не обнаруживался в серверах, которые не являются серверами Java, SEGFAULT и т. д.)

1 голос
/ 03 января 2011

Исключение «Недостаточно памяти» из-за утечек памяти.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...