Задачи ScheduledExecutorService выполняются позже, чем ожидалось - PullRequest
0 голосов
/ 08 июня 2018

Я периодически запускаю задачи, и для обеспечения гибкости интервалов следующий тайм-аут рассчитывается в конце каждой задачи, конвертируется в миллисекунды из Instant.now () и составляется по расписанию с помощью ScheduledExecutorService#schedule.

Этот код в целом работает нормально (синяя кривая слева), но в другие дни не очень хорошо.

enter image description here

Мне кажется, что вещииногда происходит сбой при запуске (машины перезагружаются каждую ночь), и хотя программа должна и исправляет себя, ScheduledExecutorService#schedule не восстанавливается, а запланированные задачи выполняются все время с опозданием.Похоже, что полный перезапуск JVM является единственным решением.

Сначала я думал, что это ошибка, и в зависимости от времени запуска машины все может пойти не так.Но следующий вывод журнала показывает, что проблема связана с моим использованием ScheduledExecutorService#schedule:

// Log time in GMT+2, other times are in GMT
// The following lines are written following system startup (all times are correct)
08 juin 00:08:49.993 [main] WARN  com.pgscada.webdyn.Webdyn - Scheduling next webdyn service time. Currently 2018-06-07T22:08:49.993Z, last connection null
08 juin 00:08:50.586 [main] INFO  com.pgscada.webdyn.Webdyn - The next data sample at 2018-06-07T22:10:00Z and the next FTP connection at 2018-06-07T22:30:00Z
08 juin 00:08:50.586 [main] WARN  com.pgscada.webdyn.Webdyn - Completed webdyn schedule in 9ms, next execution at 2018-06-07T22:10:00Z (in 69414 ms) will run as data-sample
// So we are expecting the next execution to occur at 00:10:00 (or in 69.4 seconds)
// Except that it runs at 00:11:21
08 juin 00:11:21.206 [pool-1-thread-4] INFO  com.pgscada.webdyn.Webdyn - Executing Webdyn service, isDataSample=true, isFtpConnection=false, nextTimeout=2018-06-07T22:10:00Z, lastFtpConnection=null
// But thats OK because it should correct itself
08 juin 00:13:04.151 [pool-1-thread-4] WARN  com.pgscada.webdyn.Webdyn - Scheduling next webdyn service time. Currently 2018-06-07T22:10:00Z, last connection null
08 juin 00:13:04.167 [pool-1-thread-4] INFO  com.pgscada.webdyn.Webdyn - The next data sample at 2018-06-07T22:20:00Z and the next FTP connection at 2018-06-07T22:30:00Z
08 juin 00:13:04.167 [pool-1-thread-4] WARN  com.pgscada.webdyn.Webdyn - Completed webdyn schedule in 0ms, next execution at 2018-06-07T22:20:00Z (in 415833 ms) will run as data-sample
// So now we are expecting the next execution to occur at 00:20:00 (or in 415.8 seconds)
// But it runs at 00:28:06
08 juin 00:28:06.145 [pool-1-thread-4] INFO  com.pgscada.webdyn.Webdyn - Executing Webdyn service, isDataSample=true, isFtpConnection=false, nextTimeout=2018-06-07T22:20:00Z, lastFtpConnection=null

Ниже приведен фактический производственный код функции планирования.

ScheduledExecutorService EXECUTORS = Executors.newScheduledThreadPool(10);


private void scheduleNextTimeout(Instant currentTime, Instant lastFtpConnection) {

    try {

        log.info("Scheduling next webdyn service time. Currently {}, last connection {}", currentTime, lastFtpConnection);

        // Parse config files first
        getConfigIni().parse();

        long time = System.nanoTime();
        final Instant earliestPossibleTimeout = Instant.now().plusSeconds(5); 

        Instant nextDataSample = nextTimeout(currentTime);

        if (nextDataSample.isBefore(earliestPossibleTimeout)) {
            final Instant oldTime = nextDataSample;
            nextDataSample = nextTimeout(earliestPossibleTimeout);
            log.warn("Next data sample was calculated to a time in the past '{}', resetting to a future time: {}", oldTime, nextDataSample);
        }

        Instant nextFtp = nextFtpConnection(currentTime, lastFtpConnection);

        if (nextFtp.isBefore(earliestPossibleTimeout)) {
            final Instant oldTime = nextFtp;
            nextFtp = nextFtpConnection(earliestPossibleTimeout, lastFtpConnection);
            log.warn("Next FTP connection was calculated to a time in the past '{}', resetting to a future time: {}", oldTime, nextFtp);
        }

        final boolean isFtpConnection = !nextDataSample.isBefore(nextFtp);
        final boolean isDataSample = !isFtpConnection || nextDataSample.equals(nextFtp);
        log.info("The next data sample at {} and the next FTP connection at {}", nextDataSample, nextFtp);

        final Instant nextTimeout = nextDataSample.isBefore(nextFtp) ? nextDataSample : nextFtp;
        final long millis = Duration.between(Instant.now(), nextTimeout).toMillis();
        EXECUTORS.schedule(() -> {
            log.info("Executing Webdyn service, isDataSample={}, isFtpConnection={}, nextTimeout={}, lastFtpConnection={}",
                    isDataSample, isFtpConnection, nextTimeout, lastFtpConnection);

            long tme = System.nanoTime();
            try {
                connect(isDataSample, isFtpConnection, nextTimeout, lastFtpConnection);
                log.warn("Completed webdyn service in {}s", (System.nanoTime() - tme) / 1000000);
            } catch (final Throwable ex) {
                log.error("Failed webdyn service after {}ms : {}", (System.nanoTime() - tme) / 1000000, ex.getMessage(), ex);
            } finally {
                scheduleNextTimeout(nextTimeout, isFtpConnection ? nextTimeout : lastFtpConnection);
            }
        }, millis, TimeUnit.MILLISECONDS);

        log.warn("Completed webdyn schedule in {}ms, next execution at {} (in {} ms) will run as {}",
                (System.nanoTime() - time) / 1000000, nextTimeout, millis, isFtpConnection ? "ftp-connection" : "data-sample");

    } catch (final Throwable ex) {
        log.error("Fatal error in webdyn schedule : {}", ex.getMessage(), ex);
    }
}

1 Ответ

0 голосов
/ 17 июня 2018

Как указано в моем комментарии ниже, вопрос заключается в том, что существует общий, изменчивый и не поточно-безопасный ресурс (атрибут EXECUTORS), измененный более чем одним потоком.Он изменяется основным потоком при запуске, и какой поток используется из пула для выполнения задачи.

Следует отметить, что даже , когда у вас есть только один поток, обращающийся к общему ресурсу за один раз (просто потому, что естьодновременно выполняется только одна задача), вам все же нужно подумать о concurency .Это связано с тем, что без синхронизации Java Memory Model не гарантирует, что изменения, внесенные одним потоком, будут когда-либо видны другим потокам, независимо от того, насколько позднее они будут выполнены.

Таким образом, решение заключалось бы в синхронизации метода scheduleNextTimeout , гарантируя, что изменения не будут храниться локально для выполняющегося потока и записываться в основную память.

Вы также можете сделатьсинхронизированный блок (синхронизируется по «this») вокруг части, которая обеспечивает доступ к общему ресурсу, но, поскольку система не выглядит тяжелой, а остальная часть кода, по-видимому, не занимает много времени, существуетв этом нет необходимости ...

Вот очень суть этого в хорошей и короткой статье, из которой я однажды узнал, когда впервые столкнулся с такого рода проблемами :) https://www.cs.umd.edu/~pugh/java/memoryModel/jsr-133-faq.html#jsr133

Я рад, что смог помочь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...