Ответ на эту проблему в конечном итоге не был связан с WebSphere или Oracle, но был старой доброй проблемой конфигурации сети, которая привела к тайм-аутам повторной передачи TCP между сервером WebSphere и кластером Oracle RAC.
В порядкечтобы получить эту диагностику, я посмотрел на вывод netstat -p tcp
до и после пробного запуска и обнаружил, что показатель
retransmit timeouts
увеличивается.Теперь можно просмотреть конфигурацию алгоритма тайм-аута ретрансляции с помощью:
$ no -a
...
rto_high = 64
rto_length = 13
rto_limit = 7
rto_low = 1
, что указывает на то, что тайм-ауты повторной передачи будут занимать от 1 до 64 секунд и будут все больше уменьшаться, что объясняет, почему мы наблюдаем скачки1 секунда, 2 секунды, 4 секунды, 10 секунд и 22 секунды, но ничего от этих пиков (т. Е. Нет 6-секундного скачка).
Как только конфигурация сети была исправлена, проблема исчезла.