Перво-наперво ... определите список всех изменений, никакие изменения не будут слишком незначительными.
Как только у вас появится этот список изменений, начните их резервировать по одному.
Пошаговая информация, эххх ... это сложно. Я всегда ищу что-то очевидное. Если я увижу что-то, что выглядит подозрительно, я перестану делать то, что я делаю, и продолжу расследование, или я помещу это на доску как возможную проблему.
1) Опять же, я всегда начинаю с создания списка всего, что изменилось с каждым элементом инфраструктуры (Брандмауэр, Коммутатор, БД, HotFix, Веб-сервер, ...) Если что-то изменилось, я всегда запрашиваю больше информации об этом изменении. Я полагаю, что у вас нет такой информации, а не потому, что я пытаюсь вас унизить, организациям требуется некоторое время, прежде чем они достигнут надлежащего уровня зрелости, когда их операции начинают регистрировать все изменения.
2) Начни смотреть логи. Поскольку все мои приложения находятся на Windows Server, я начинаю с просмотра журнала событий приложений. Я ищу ошибки приложения. Затем я иду в журнал системных событий, снова я ищу ошибки. Затем я могу выполнить анализ журналов IIS .... Обычно в этих журналах включено поле времени, поэтому я сосредотачиваюсь на долго выполняющихся запросах.
3) Далее я посмотрю на сервере БД. Я попрошу моего администратора баз данных запустить SQL Profiler, чтобы посмотреть, какие запросы занимают много времени. Я также попрошу их собрать информацию о блокировках базы данных. Я также прошу их проверить работоспособность БД (обновлены ли индексы, фрагментированы ли таблицы / индексы).
4) Далее у меня есть администраторы Windows Server, собирающие статистику счетчиков производительности на веб-сервере и SQL Server. Я хочу искать утечки памяти, очереди ввода-вывода, использование процессора.