запрос веб-страницы с 10 картинками и некоторым текстом зависает на nginx и php-fpm и отключает другие службы? - PullRequest
0 голосов
/ 07 мая 2019

возможно ли, что запрос на страницу, где у сервера или php может возникнуть проблема, зависает и даже отключает другие не связанные службы SSH?

Я запускаю простую веб-страницу (10 картинок и немного текста) в докеризованной среде с отдельным обратным прокси-сервером, веб-сервером, базой данных (nginx, php-fpm и postgresql).

Вся система работала без перезапуска в течение года или около того, без проблем. Теперь у меня недавно возникшая проблема (около месяца) с зависанием страницы / системы. Когда я захожу на мою веб-страницу, она время от времени блокируется (иногда достаточно одного экземпляра, иногда мне нужно открыть до 20 раз), и мне нужно около 30 секунд, чтобы снова начать реагировать. Странно то, что если я подключен в параллельно с SSH серверу, он иногда (не всегда) также отключает мой терминал. Вот почему я считал, что нужно что-то делать с системой (но там ничего не могу найти, поэтому пробую здесь другую точку зрения).

сервер (доступен только удаленный доступ): Debian GNU / Linux 9.4 (растянутая) Ядро: 4.9.0-6-amd64 # 1 SMP Debian 4.9.82-1 + deb9u3 (2018-03-02) x86_64 GNU / Linux Оперативная память 68 ГБ, 8 ядер, жесткие диски 2x4 ТБ и SDD 1 ТБ 1 Гбит-Uplink

У меня установлен мониторинг, и кажется, что во время блокировки не наблюдается какой-либо высокой нагрузки на устройства ввода-вывода, сеть, ЦП или другое (хотя я не отслеживаю php-статистику). У меня также есть та же самая установка, работающая на локальном тестовом сервере (другое оборудование и ядро ​​4.9.0-6-amd64 # 1 SMP Debian 4.9.88-1 + deb9u1 (2018-05-07) x86_64 GNU / Linux) и этот сервер не имеет проблем с зависанием, так что опять аргумент против этой проблемы связан с докеризованной средой или кодом моей страницы.

До сих пор я занимался аппаратной частью:

  • 1.) Диагностика SMART - без каких-либо явных проблем («резервный диск (не тот, на котором сохранены серверы)» в течение некоторого времени: 191 G-Sense_Error_Rate 0x0032 001 001 000, но провайдер отдельный тест некоторое время назад и сказал, что диск не имеет проблем, и что G-Sense_Error_Rate в любом случае имеет небольшое информационное значение)
  • 2.) Поверх (htop и iotop работают и SSH отключается, поэтому я не могу наблюдать за тем, как возникает проблема) через интервал 1 с и 300 выборок (таким образом, 5 минут), где я смог произвести несколько остановок, но там не было никаких явных проблем с нагрузкой (если это первый раз, когда я глядя на эти вещи! - но также не было линии высокого уровня окраска поверх которой выполняется автоматически)
  • 3.) У меня также работает докеризованный стек мониторинга (зависание происходит при его работе и при отключении, поэтому он не должен отсюда тоже) где я могу просматривать докеры отдельно и они также не показывают ничего тревожного
  • 4.) Перезапустил весь сервер - проблема продолжается
  • 5.) Memtester-d 55 из 65 ОЗУ без проблем
  • 6.) Нет проблем в системном журнале
  • 7.) Пропингуйте сервер, пока выдает ошибку, и пинг быстрый с 27 мс, но когда сервер зависает, я теряю 1 пинг примерно через 10 (в эти 30-40 с, тогда пинг снова идеален). Но я не могу понять, почему это

Где еще я мог посмотреть ????

Любые предложения высоко ценятся! Спасибо!

1 Ответ

0 голосов
/ 07 мая 2019

Странно, что это начало происходить только в последние несколько месяцев и раньше было хорошо.

Вы загружаете последнее изображение для nginx, postgres ... и т. Д.? Возможно, это проблема с версией изображений и может попытаться использовать определенный выпуск.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...