Эта проблема появилась сегодня, и я понятия не имею, что происходит. Пожалуйста, поделитесь своими идеями.
У меня есть 1 сервер БД EC2 (MYSQL + общий доступ к файлам NFS + Memcached).
И у меня есть 3 веб-сервера EC2 (lighttpd), где он будет монтировать папки NFS на сервере БД.
В течение нескольких месяцев все идет гладко, но внезапно возникает интересное явление.
Каждые 8-10 минут PHP-файл будет недоступен. Это будет длиться около 1 минуты, а затем возвращается в нормальное состояние. Нормальные файлы, такие как .html, не затрагиваются. Все серверы имеют одинаковую проблему в одно и то же время.
Я провел целый день, чтобы проанализировать причину. Наконец, я выясняю, когда возникает проблема, файловый дескриптор lighttpd внезапно сильно увеличился.
Я использовал ls /proc/1234/fd | wc -l
, чтобы проверить число fd
.
Число fd
составляет около 250 в обычное время. Однако, когда проблема возникла, она будет повышена до 1500, а затем вернется к нормальной.
Звучит смешно, правда? Ты хоть представляешь, что происходит?
========================
График ЦП одного из веб-серверов.
альтернативный текст http://pencake.images.s3.amazonaws.com/4be1055884133.jpg