Я создал модель, используя ноутбук и java aws sdk, когда я вызываю конечную точку, которая занимает около 7 секунд. Как я могу уменьшить это дальше и есть ли способ иметь параллельные вызовы.
InvokeEndpointRequest request = new InvokeEndpointRequest();
InvokeEndpointResult p = amazonSageMakerRuntime.invokeEndpoint(request.withEndpointName("<endpoint>").withAccept("application/json").withContentType("application/json").withBody(ByteBuffer.wrap(data.getBytes())));