Как исправить «SQLRecoverableException: закрытое соединение» в Java - PullRequest
0 голосов
/ 02 апреля 2019

Мы работаем над электронной коммерцией, построенной на платформе Hybris, и в настоящее время у нас есть проблема с подключением к базе данных (я полагаю), и мы не знаем, как ее решить.Это происходит только в производственной среде и только на серверах, которые используются ESB (2 сервера в общей сложности 40).

В основном, иногда (1-3 в день), мы обнаруживаем сеансы, ожидающие некоторого простоя(SEL * NET сообщение от клиента).Мы можем только вручную убить владельца, чтобы освободить эти сеансы.

Все серверы используют один и тот же код приложения, и основное различие между серверами ESB и Frontend заключается в вызываемых контроллерах и в количестве запросов.

ESB-сервер: 10 запросов в минуту. Внешний сервер: 300 запросов в минуту

В журнале приложений я обнаружил множество ошибок закрытого соединения на этих 2 серверах, и я думаю, что это связано снаша проблема, но на самом деле я не знаю почему.В access.log у меня есть этот запрос:

[26/Mar/2019:09:04:39 +0100] "GET /blockorder?orderCode=XXXX&access_token=XXXX HTTP/1.1" 400 122 "-" "AHC/1.0"

и в console.log у меня есть это:

hybrisHTTP8 2019-03-26 09:04:39,184 ERROR [[10.125.31.2] ] () [de.hybris.platform.jdbcwrapper.ConnectionImpl] error resetting AutoCommit
java.sql.SQLRecoverableException: Closed Connection
        at oracle.jdbc.driver.PhysicalConnection.setAutoCommit(PhysicalConnection.java:3763)
        at de.hybris.platform.jdbcwrapper.ConnectionImpl.doSetAutoCommit(ConnectionImpl.java:431)
        at de.hybris.platform.jdbcwrapper.ConnectionImpl.restoreAutoCommit(ConnectionImpl.java:185)
        at de.hybris.platform.jdbcwrapper.ConnectionImpl.unsetTxBound(ConnectionImpl.java:175)
        at de.hybris.platform.tx.Transaction.unsetTxBoundConnection(Transaction.java:920)
        at de.hybris.platform.tx.Transaction.clearTxBoundConnectionAndNotify(Transaction.java:897)
        at de.hybris.platform.tx.Transaction.clearTxBoundConnectionAndNotifyRollback(Transaction.java:887)
        at de.hybris.platform.tx.Transaction.rollbackOuter(Transaction.java:1084)
        at de.hybris.platform.tx.Transaction.rollback(Transaction.java:1028)
        at de.hybris.platform.tx.Transaction.commit(Transaction.java:690)
        at de.hybris.platform.tx.Transaction.finishExecute(Transaction.java:1218)
        at de.hybris.platform.tx.Transaction.execute(Transaction.java:1205)
        at de.hybris.platform.tx.Transaction.execute(Transaction.java:1160)
        at de.hybris.platform.jalo.Item.setAllAttributes(Item.java:2082)
        at de.hybris.platform.jalo.Item.setAllAttributes(Item.java:2057)
        at de.hybris.platform.servicelayer.internal.converter.impl.ItemModelConverter.storeAttributes(ItemModelConverter.java:1503)
        at de.hybris.platform.servicelayer.internal.converter.impl.ItemModelConverter.save(ItemModelConverter.java:730)
        at de.hybris.platform.servicelayer.internal.model.impl.wrapper.ModelWrapper.save(ModelWrapper.java:336)
        at de.hybris.platform.servicelayer.internal.model.impl.ResolvingModelPersister.saveOthers(ResolvingModelPersister.java:64)
        at de.hybris.platform.servicelayer.internal.model.impl.ResolvingModelPersister.persist(ResolvingModelPersister.java:49)
        at de.hybris.platform.servicelayer.internal.model.impl.DefaultModelService.saveViaJalo(DefaultModelService.java:1059)
        at de.hybris.platform.servicelayer.internal.model.impl.DefaultModelService.doJaloPersistence(DefaultModelService.java:648)
        at de.hybris.platform.servicelayer.internal.model.impl.DefaultModelService.persistWrappers(DefaultModelService.java:1002)
        at de.hybris.platform.servicelayer.internal.model.impl.DefaultModelService.performPersistenceOperations(DefaultModelService.java:626)
        at de.hybris.platform.servicelayer.internal.model.impl.DefaultModelService.saveAllInternal(DefaultModelService.java:620)
        at de.hybris.platform.servicelayer.internal.model.impl.DefaultModelService.saveAll(DefaultModelService.java:600)
        at de.hybris.platform.servicelayer.internal.model.impl.DefaultModelService.save(DefaultModelService.java:548)
        at com.test.fulfilment.process.impl.DefaultOrderProcessService.requestForcedOrderCancellation(DefaultOrderProcessService.java:131)
        at com.test.application.order.facades.impl.DefaultOrderFacade.forcedOrderCancel(DefaultOrderFacade.java:62)
        at com.test.application.controllers.OrderController.blockOrder(OrderController.java:520)

Наша конфигурация пула выглядит следующим образом:

{
    "maxIdle": 90,
    "minIdle": 2,
    "maxActive": 90,
    "maxWait": 10000,
    "whenExhaustedAction": 1,
    "testOnBorrow": true,
    "testOnReturn": true,
    "testWhileIdle": true,
    "timeBetweenEvictionRunsMillis": 10000,
    "numTestsPerEvictionRun": 100,
    "minEvictableIdleTimeMillis": 300000,
    "softMinEvictableIdleTimeMillis": -1,
    "lifo": true
}

Наша конфигурация tomcat:

tomcat.generaloptions.JDBC=-Doracle.jdbc.ReadTimeout=60000
tomcat.generaloptions.TIMEOUT=-Dsun.net.client.defaultConnectTimeout\=60000 -Dsun.net.client.defaultReadTimeout\=60000
tomcat.ajp.acceptCount=100
tomcat.ajp.maxThreads=400
tomcat.maxthreads=400
tomcat.minsparethreads=50
tomcat.maxidletime=10000
tomcat.connectiontimeout=120000
tomcat.acceptcount=100

Мы попытались удалить oracle.jdbc.ReadTimeout, но в результате мы начали видеть закрытые соединения на других серверах.

код, который вызывает эту ошибку, довольно прост (и он работает в 95% случаев):

    @Override
    public boolean requestForcedOrderCancellation(final OrderModel order) {
        Transaction.current().begin();
        try {
            modelService.lock(order.getPk());
            modelService.refresh(order);
            order.setForcedCancelled(true);
            modelService.save(order);
            Transaction.current().commit();
            return true;
        catch (Exception e) {
            LOG.error(e.getMessage(), e);
            Transaction.current().rollback();
            return false;
        }
    }

Мы также пытались без явной блокировки, и проблема точно такая же.Кажется, что соединение уже закрыто, и мы не можем откатить (или зафиксировать) транзакции, которые все еще ожидают в БД.

Я ожидаю избежать этой блокировки и этих закрытых ошибок соединения.

1 Ответ

0 голосов
/ 02 апреля 2019

Ваш пул соединений, вероятно, исправляет это уже для вас.Попробуйте увеличить количество записей в журнале, чтобы выяснить, действительно ли это так.Поэтому они имеют тенденцию закрывать соединение через некоторое время.Другим виновником являются брандмауэры, которые имеют тенденцию удалять незанятые соединения из своих таблиц.Пулы соединений знают, как справиться с этим, проверяя соединения (все эти опции test* в вашей конфигурации выше).

Иногда вам нужно указать пулу, как тестировать соединение.Проверьте документацию.Для Oracle хорошим тестом является select 1 from dual.

Я думаю, что ваша настоящая проблема - это зависание сеансов.Узнайте, чего они ждут, посмотрев дамп потока Java, который вы можете создать с помощью инструмента jstack, поставляемого с Java SDK.

...