Какой вариант для Presto отобразить несколько строк в один файл в S3? - PullRequest
0 голосов
/ 20 сентября 2019

Я пользуюсь службой EMR с предварительным включением.Создала одну схему под этой созданной таблицей с параметром external_location, указывающим на корзину s3.

Когда я пытаюсь вставить данные в таблицу через presto-cli каждый раз, когда она генерирует новый файл в s3.Есть ли возможность сохранить несколько строк в одном файле в s3.

1 Ответ

2 голосов
/ 20 сентября 2019

Presto INSERT всегда создает новый файл (ы), независимо от используемого хранилища.Кроме того, хранилище S3 - однократная запись, добавление отсутствует.Чтобы иметь один файл, вам нужно написать один INSERT или CREATE TABLE .. AS запрос.

В одном запросе INSERT вы можете вставить несколько строк:

INSERT INTO t (a,b,c) VALUES ('a', 'b', 'c'), ('a2', 'b2', 'c2'), ...;
...