Медленные передачи в Jetty с частичным кодированием передачи при определенном размере буфера - PullRequest
17 голосов
/ 27 января 2012

Я исследую проблему с производительностью Jetty 6.1.26. Jetty, похоже, использует Transfer-Encoding: chunked, и в зависимости от используемого размера буфера это может быть очень медленно при локальной передаче.

Я создал небольшое тестовое приложение Jetty с одним сервлетом, демонстрирующим проблему.

import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.OutputStream;

import javax.servlet.ServletException;
import javax.servlet.http.HttpServlet;
import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;

import org.mortbay.jetty.Server;
import org.mortbay.jetty.nio.SelectChannelConnector;
import org.mortbay.jetty.servlet.Context;

public class TestServlet extends HttpServlet {

    @Override
    protected void doGet(HttpServletRequest req, HttpServletResponse resp)
            throws ServletException, IOException {
        final int bufferSize = 65536;
        resp.setBufferSize(bufferSize);
        OutputStream outStream = resp.getOutputStream();

        FileInputStream stream = null;
        try {
            stream = new FileInputStream(new File("test.data"));
            int bytesRead;
            byte[] buffer = new byte[bufferSize];
            while( (bytesRead = stream.read(buffer, 0, bufferSize)) > 0 ) {
                outStream.write(buffer, 0, bytesRead);
                outStream.flush();
            }
        } finally   {
            if( stream != null )
                stream.close();
            outStream.close();
        }
    }

    public static void main(String[] args) throws Exception {
        Server server = new Server();
        SelectChannelConnector ret = new SelectChannelConnector();
        ret.setLowResourceMaxIdleTime(10000);
        ret.setAcceptQueueSize(128);
        ret.setResolveNames(false);
        ret.setUseDirectBuffers(false);
        ret.setHost("0.0.0.0");
        ret.setPort(8080);
        server.addConnector(ret);
        Context context = new Context();
        context.setDisplayName("WebAppsContext");
        context.setContextPath("/");
        server.addHandler(context);
        context.addServlet(TestServlet.class, "/test");
        server.start();
    }

}

В моем эксперименте я использую тестовый файл объемом 128 МБ, который сервлет возвращает клиенту, который подключается с помощью localhost. Загрузка этих данных с использованием простого тестового клиента, написанного на Java (с использованием URLConnection), занимает 3,8 секунды, что очень медленно (да, это 33 МБ / с, что не звучит медленно, за исключением того, что это чисто локально и входной файл был кэширован, это должно быть намного быстрее).

Теперь вот где это становится странным. Если я загружаю данные с помощью wget, который является клиентом HTTP / 1.0 и поэтому не поддерживает частичное кодирование передачи, это займет всего 0,1 секунды. Это намного лучше.

Теперь, когда я меняю bufferSize на 4096, клиент Java занимает 0,3 секунды.

Если я полностью удаляю вызов resp.setBufferSize (который, похоже, использует размер фрагмента 24 КБ), клиент Java теперь занимает 7,1 секунды, а wget внезапно становится таким же медленным!

Пожалуйста, обратите внимание, что я никоим образом не эксперт по Jetty. Я наткнулся на эту проблему при диагностике проблемы с производительностью в Hadoop 0.20.203.0 с уменьшенным перетасованием задач, который передает файлы с использованием Jetty так же, как сокращенный пример кода, с размером буфера 64 КБ.

Проблема воспроизводится как на наших серверах Linux (Debian), так и на моем компьютере с Windows, а также на Java 1.6 и 1.7, поэтому, похоже, она зависит исключительно от Jetty.

Кто-нибудь знает, что может быть причиной этого, и если я что-то могу с этим поделать?

Ответы [ 3 ]

13 голосов
/ 31 января 2012

Я полагаю, что нашел ответ сам, просматривая исходный код Jetty.На самом деле это сложное взаимодействие размера буфера ответа, размера буфера, переданного в outStream.write, и от того, вызывается или нет outStream.flush (в некоторых ситуациях).Проблема в том, как Jetty использует свой внутренний буфер ответа, и как данные, которые вы записываете в вывод, копируются в этот буфер, а также когда и как этот буфер сбрасывается.

Если размер используемого буферас outStream.write равно буферу ответов (я думаю, что кратное тоже работает), или меньше, и используется outStream.flush, тогда производительность в порядке.Каждый write вызов затем сбрасывается прямо на выход, что нормально.Однако, когда буфер записи больше и не кратен буферу ответов, это, кажется, вызывает некоторую странность в том, как обрабатываются сбросы, вызывая дополнительные сбросы, что приводит к снижению производительности.

В случае чанкованногоПередача кодировки, есть дополнительный перегиб в кабеле.Для всех, кроме первой порции, Jetty резервирует 12 байтов буфера ответов для хранения размера порции.Это означает, что в моем исходном примере с буфером записи и ответа размером 64 КБ фактический объем данных, который помещается в буфер ответов, составлял всего 65524 байта, поэтому опять части буфера записи были разлиты в несколько сбросов.Глядя на захваченную сетевую трассировку этого сценария, я вижу, что первый блок равен 64 КБ, но все последующие блоки составляют 65524 байта.В этом случае outStream.flush не имеет значения.

При использовании буфера 4 КБ, я видел быструю скорость только при вызове outStream.flush.Оказывается, что resp.setBufferSize только увеличит размер буфера, и, поскольку размер по умолчанию составляет 24 КБ, resp.setBufferSize(4096) не используется.Тем не менее, я теперь писал части данных по 4 КБ, которые помещаются в буфер размером 24 КБ даже с зарезервированными 12 байтами, а затем очищаются как блок размером 4 КБ при вызове outStream.flush.Однако, когда вызов к flush удален, он позволит буферу заполниться, опять же с 12 байтами, разливающимися в следующий блок, потому что 24 кратно 4.

В заключение

Похоже, что для получения хорошей производительности с Jetty, вы должны либо:

  • при вызове setContentLength (без кодирования передачи по частям) и использовать буфер для write того же размера, что и ответразмер буфера.
  • При использовании кодирования с частичной передачей используйте буфер записи, размер которого как минимум на 12 байтов меньше размера буфера ответа, и после каждой записи вызывайте flush.

Примечаниечто производительность «медленного» сценария по-прежнему такова, что вы, скорее всего, увидите разницу только на локальном хосте или очень быстром (1 Гбит / с или более) сетевом соединении.

Полагаю, мне следует подавать отчеты о проблемахHadoop и / или Jetty для этого.

1 голос
/ 30 января 2012

Да, Jetty по умолчанию будет Transfer-Encoding: Chunked, если невозможно определить размер ответа.

Если вы знаете размер ответа, что это будет. Вам нужно позвонить resp.setContentLength(135*1000*1000*1000); в этом случае вместо

resp.setBufferSize();

на самом деле установка resp.setBufferSize не имеет значения.

Перед открытием OutputStream, то есть перед этой строкой: OutputStream outStream = resp.getOutputStream(); тебе нужно позвонить resp.setContentLength(135*1000*1000*1000);

(строка выше)

Дай ему вращение. посмотрим, работает ли это. Это мои догадки из теории.

0 голосов
/ 30 января 2012

Это чистое предположение, но я предполагаю, что это какая-то проблема с сборщиком мусора. Производительность Java-клиента улучшается, когда вы запускаете JVM с большей кучей, как ... java -Xmx 128м

Я не помню, чтобы переключатель JVM включил ведение журнала GC, но выясню это и посмотрите, включится ли GC, когда вы входите в свой doGet.

Мои 2 цента.

...