Я использую Async Http Client для загрузки большого количества (возможно, больших) файлов из Интернета.
В моем конкретном случае мне нужно переслать InputStream байтов с этих URL-адресов для загрузки другому сервису для анализа.
Наивный подход заключается в следующем:
AsyncHttpClient asyncHttpClient = Dsl.asyncHttpClient(Dsl.config()
.setMaxConnectionsPerHost(-1)
.setMaxConnections(-1)
.setPooledConnectionIdleTimeout(60 * 10 * 1000)
.setConnectionTtl(6 * 60 * 1000)
.setConnectTimeout(5 * 1000)
.setRequestTimeout(5 * 60 * 1000)
.setFollowRedirect(true)
.setRealm(new Realm.Builder(username, password)
.setNtlmDomain(domain)
.setScheme(Realm.AuthScheme.NTLM)
.build())
Response httpGetResponse = asyncHttpClient.prepareGet(url).execute().get();
return httpGetResponse.getResponseBodyAsStream();
Но в этом руководстве для асинхронных http-запросов мы узнаем, что в отличие от HTTP-клиента HTTP Components, асинхронный http-клиент загружает весь файл в память.
В моем случае это быстро вызовет OOM.
Таким образом, альтернатива такова:
Response httpGetResponse = asyncHttpClient.prepareGet(url).execute(new AsyncHandler<Response>() {
private final Response.ResponseBuilder builder = new Response.ResponseBuilder();
@Override
public State onBodyPartReceived(HttpResponseBodyPart bodyPart) throws Exception {
bodyPart.getBodyByteBuffer(); // Each chunk of bytes will be fed into this method.
// I need to write these bytes to the resuting input stream
// without streaming them all into memory.
return State.CONTINUE;
}
@Override
public State onHeadersReceived(HttpHeaders headers) throws Exception {
builder.accumulate(headers);
return State.CONTINUE;
}
@Override
public State onStatusReceived(HttpResponseStatus responseStatus) throws Exception {
builder.accumulate(responseStatus);
return State.CONTINUE;
}
@Override
public Response onCompleted() throws Exception {
return builder.build();
}
@Override
public void onThrowable(Throwable t) {
}
}).get();
Какой самый простой и чистый способ получить эти байты какони приходят во входной поток?
У меня есть две идеи:
1) Записать входные данные в файл, затем передать файл или 2) Сразу же возвратить поток ввода по конвейеру, и байты будут записаны в поток ввода по конвейерукак они получены.
У кого-нибудь есть рабочий пример, которым он может поделиться с этим?