Как вы решаете проблему, которая является невоспроизводимой, случайной, а изменения не могут быть немедленно проверены? - PullRequest
1 голос
/ 16 декабря 2010

Я подумал, что выкину это и посмотрю, на что похож опыт других людей.

У меня возникла проблема с системой на работе, когда она прекращает обработку заданий в очереди и, так сказать, «застревает». После перезапуска служб программа обрабатывает очередь, и все возвращается в нормальное состояние.

По моему опыту, я пока не могу понять, что является причиной этих остановок. Это, и я не могу воспроизвести остановку сам. Очередь завершается с ошибкой на всех различных интервалах, иногда выполняется в течение месяца подряд, в других случаях происходит сбой всего в два раза за 1 день С тех пор я привлек двух разных поставщиков и разных коллег в отделе, и все были в тупике, и это было в течение нескольких месяцев.

С тех пор, как я начал, мы изолировали обработку на одном сервере и включили регистрацию, которую мы отправили поставщикам. Никто не знает, в чем проблема.

Мы обновили несколько настроек здесь и там, обновили клиентские и серверные компоненты, но мы не знаем, способствует ли то, что мы делаем, общему решению.

Итак, у меня проблема в том, что представляется невоспроизводимым, случайным и непроверяемым.

Кто-нибудь был связан с подобными ситуациями? Как можно решить такую ​​ситуацию?

Любой совместный вклад или опыт будут великолепны.

Приветствия

РЕДАКТИРОВАТЬ: : Включил ведение журнала, обновил все компоненты до последней версии и убедился, что были сделаны правильные антивирусные исключения, и до сих пор он не сработал в течение месяца!

Ответы [ 2 ]

2 голосов
/ 16 декабря 2010

Используйте каркас ведения журналов, который можно включить в производстве.Вначале вам может понадобиться слишком много журналирования, но это должно помочь сузить проблему, и когда вы приблизитесь, вы можете сузить область регистрации и одновременно увеличить многословие (это слово) оставшихся операторов журнала.

0 голосов
/ 16 декабря 2010

В дополнение к регистрации, как указал Келли, существует возможность тупиковой ситуации, поскольку вещи, кажется, прекращаются. Один из вариантов, если это Java-приложение, - использовать jconsole и подключаться к экземпляру JVM. В jconsole есть опция обнаружения тупиковых ситуаций, которая может предоставить очень ценную информацию при зависании.

Если это не приложение Java, а, возможно, приложение .NET, вы можете использовать эту технику .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...