Для всех экспертов AWS мне нужна ваша помощь в проектировании и архитектуре конвейера данных больших данных. Ниже приведен сценарий: -
У меня есть большие файлы расширения .gz в S3, от МБ до ГБ. Это сжатые файлы журнала формата w3c. Теперь я хочу, чтобы эти файлы были загружены в конвейер BigData, разархивировали данные из файлов и затем преобразовали их в необходимые столбцы данных.
Не могли бы вы все эксперты AWS предоставить мне какое-нибудь дизайнерское решение, использующее готовые инструменты, инструменты с открытым исходным кодом или любые таможенные инструменты для достижения вышеуказанного конвейера данных.