У меня есть текущий искровой конвейер, который работает с относительно небольшим количеством данных. Тестирование производительности для такого количества данных только поможет мне, и в идеале я хотел бы протестировать конвейер зажигания на большом количестве данных.
Существуют ли какие-либо методологии или инструменты для имитации или имитации большого количества входных данных для обработки искрой, особенно когда ввод поступает из Amazon S3? Я не хочу, чтобы искра загорелась, когда я начну получать больше данных.
У меня есть схема JSON, которой должны следовать входные данные, если это поможет.
Я не против, если решение включает в себя генерацию ложных входных данных в самой искре или генерацию ложных входных данных на s3.