У нас есть множество файлов в S3, всего десятки гигабайт. Нам нужно перевести их в формат CSV, в настоящее время файлы имеют разделители, которые не являются запятыми. Обычно я делаю это на сервере, используя sed, но мне не нужно передавать файлы на сервер, я хочу читать напрямую из S3, построчно переводить в CSV и записывать результаты обратно в новые файлы S3 .
Клей, кажется, в состоянии сделать это, но я чувствую, что кривая обучения и настройка для такой простой задачи излишни.
Нет ли какого-нибудь простого способа выполнить такие простые задачи, например, в EMR или другом инструменте AWS? Мы используем Athena, и мне интересно, можно ли это сделать в SQL-выражении с использованием Athena? Спасибо