Использование AWS EMR для обновления данных S3 - PullRequest
0 голосов
/ 12 ноября 2018

Я кладу файлы паркета в корзину S3 и использую Athena для запроса.Я хотел бы внести изменения в свои данные на уровне строк, но я стараюсь не тратить гигабайты паркетных данных, изменять и перезагружать их.

Я все утро связывался с EMR, получаязнакомы с доступными инструментами, но ни один из них не подходит в качестве решения.

Позволит ли какой-либо из инструментов EMR выполнить запрос типа UPDATE x SET foo = 'bar' по моим существующим данным паркетного пространства s3?

...