возможно ли, что запрос на страницу, где у сервера или php может возникнуть проблема, зависает и даже отключает другие не связанные службы SSH?
Я запускаю простую веб-страницу (10 картинок и немного текста) в докеризованной среде с отдельным обратным прокси-сервером, веб-сервером, базой данных (nginx, php-fpm и postgresql).
Вся система работала без перезапуска в течение года или около того, без проблем. Теперь у меня недавно возникшая проблема (около месяца) с зависанием страницы / системы. Когда я захожу на мою веб-страницу, она время от времени блокируется (иногда достаточно одного экземпляра, иногда мне нужно открыть до 20 раз), и мне нужно около 30 секунд, чтобы снова начать реагировать. Странно то, что если я подключен в параллельно с SSH серверу, он иногда (не всегда) также отключает мой терминал. Вот почему я считал, что нужно что-то делать с системой (но там ничего не могу найти, поэтому пробую здесь другую точку зрения).
сервер (доступен только удаленный доступ):
Debian GNU / Linux 9.4 (растянутая)
Ядро: 4.9.0-6-amd64 # 1 SMP Debian 4.9.82-1 + deb9u3 (2018-03-02) x86_64 GNU / Linux
Оперативная память 68 ГБ, 8 ядер, жесткие диски 2x4 ТБ и SDD 1 ТБ
1 Гбит-Uplink
У меня установлен мониторинг, и кажется, что во время блокировки не наблюдается какой-либо высокой нагрузки на устройства ввода-вывода, сеть, ЦП или другое (хотя я не отслеживаю php-статистику). У меня также есть та же самая установка, работающая на локальном тестовом сервере (другое оборудование и ядро 4.9.0-6-amd64 # 1 SMP Debian 4.9.88-1 + deb9u1 (2018-05-07) x86_64 GNU / Linux) и этот сервер не имеет проблем с зависанием, так что опять аргумент против этой проблемы связан с докеризованной средой или кодом моей страницы.
До сих пор я занимался аппаратной частью:
- 1.) Диагностика SMART - без каких-либо явных проблем («резервный диск (не тот, на котором сохранены серверы)» в течение некоторого времени: 191
G-Sense_Error_Rate 0x0032 001 001 000, но провайдер
отдельный тест некоторое время назад и сказал, что диск не имеет проблем, и
что G-Sense_Error_Rate в любом случае имеет небольшое информационное значение)
- 2.) Поверх (htop и iotop работают и SSH отключается, поэтому я не могу наблюдать за тем, как возникает проблема) через интервал 1 с и 300 выборок
(таким образом, 5 минут), где я смог произвести несколько остановок, но там
не было никаких явных проблем с нагрузкой (если это первый раз, когда я
глядя на эти вещи! - но также не было линии высокого уровня
окраска поверх которой выполняется автоматически)
- 3.) У меня также работает докеризованный стек мониторинга (зависание происходит при его работе и при отключении, поэтому он не должен
отсюда тоже) где я могу просматривать докеры отдельно и
они также не показывают ничего тревожного
- 4.) Перезапустил весь сервер - проблема продолжается
- 5.) Memtester-d 55 из 65 ОЗУ без проблем
- 6.) Нет проблем в системном журнале
- 7.) Пропингуйте сервер, пока выдает ошибку, и пинг быстрый с 27 мс, но когда сервер зависает, я теряю 1 пинг примерно через 10 (в эти 30-40 с, тогда пинг снова идеален). Но я не могу понять, почему это
Где еще я мог посмотреть ????
Любые предложения высоко ценятся!
Спасибо!