Всегда ли формат json при выборе со сцены? - PullRequest
0 голосов
/ 21 февраля 2020

Snowflake поддерживает несколько типов файлов путем создания FILE_FORMAT (avro, json, csv et c).

Теперь я проверил SELECT из этапа снежинки (s3) для обоих:

  • *. Avro-файлов (сгенерировано из nifi-процессора для пакетной обработки 10k * таблица oracle).
  • *. json файлов (json на строку).

И когда выберите $ 1 из @myStg, снежинка расширяется на столько строк, сколько записей в файлах avro или json (круто), но .. вариант $ 1 - это и формат json, и теперь я задаюсь вопросом, делает ли используемая нами снежинка file_format запись? всегда поступать как json на вариант $ 1? Я не проверял csv или другие снежинки file_formats.

Или мне интересно, получаю ли я json из avros (из таблицы oracle), потому что, возможно, процессор NiFi создает файлы avro (с внутренним использованием json) формат). Может быть, я путаюсь здесь ... я знаю, что avro файлы содержат оба:

  • avro schema - язык, похожий на json ключ / значение.
  • сжатые данные (двоичные).

Спасибо, Эммануил О.

1 Ответ

0 голосов
/ 21 февраля 2020

Я пытался с CSV, когда он пришел к CSV, он разбирает каждую запись в файле, как показано ниже Querying stage

Так что, когда он достигнет JSON, он обработает одну полную JSON как одна запись, так что она отображается в формате JSON.

Надеюсь, это поможет!

Большое спасибо, Срига

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...