Обрабатывая данные, разделенные символом cedilla, поддерживает ли Athena этот формат? - PullRequest
0 голосов
/ 29 января 2019

Я тестирую файлы CSV, TSV, Parquet в Athena и через консоль. Я могу выбрать формат и создать внешний поверх данных (который находится в s3), но я не вижу там опции формата с разделителями-кедиллами?

Я хочу обработать данные, разделенные символом cedilla, поддерживает ли Athena этот формат?

1 Ответ

0 голосов
/ 30 января 2019

Консоль, вероятно, не лучший способ делать то, что вы хотите.Это немного ограничено.Вместо этого вы должны попытаться создать таблицу, используя только SQL-оператор CREATE TABLE.

Вот вам пример:

CREATE EXTERNAL TABLE my_table ( c1 INT, c2 INT, c3 INT, c4 STRING ) ROW FORMAT DELIMITED FIELDS TERMINATED BY 'ç' -- <-- Here es where you specify your delimiter ESCAPED BY '\\' LINES TERMINATED BY '\n' LOCATION 's3://my-bucket/tsv/';

Попробуйте использовать этот способ.Единственное ограничение, которое я могу вспомнить сейчас, это то, что вы не можете использовать более одного символа в качестве разделителя.

...