Невозможно преобразовать varchar в массив в Presto Athena - PullRequest
1 голос
/ 16 мая 2019

Мои данные в формате varchar. Я хочу разделить оба элемента этого массива, чтобы затем извлечь значение ключа из json.

Data format:

[
  {
    "skuId": "5bc87ae20d298a283c297ca1",
    "unitPrice": 0,
    "id": "5bc87ae20d298a283c297ca1",
    "quantity": "1"
  },

{
    "skuId": "182784738484wefhdchs4848",
    "unitPrice": 50,
    "id": "5bc87ae20d298a283c297ca1",
    "quantity": "4"
  },
]

Например, Я хочу извлечь skuid из приведенного выше столбца. Поэтому мои данные после извлечения должны выглядеть так:

1 5bc87ae20d298a283c297ca1
2 182784738484wefhdchs4848

Преобразование в массив не работает например, выбор приведения (столбец как массив) дает следующую ошибку: Неизвестный тип: массив

Так что я не могу развернуть массив.

Как мне решить эту проблему в Афине?

1 Ответ

4 голосов
/ 16 мая 2019

Вы можете использовать комбинацию для анализа значения как JSON , приведения его к структурированному типу SQL (массив / карта / строка) и UNNEST WITH ORDINALITY для извлечения элементов из массива в виде отдельных строк. Обратите внимание, что это работает, только если элементы массива в полезной нагрузке JSON не имеют запятых в конце. В вашем примере он есть, но он исключен из примера ниже.

WITH data(value) AS (VALUES
 '[
    {
      "skuId": "5bc87ae20d298a283c297ca1",
      "unitPrice": 0,
      "id": "5bc87ae20d298a283c297ca1",
      "quantity": "1"
    },
    {
      "skuId": "182784738484wefhdchs4848",
      "unitPrice": 50,
      "id": "5bc87ae20d298a283c297ca1",
      "quantity": "4"
    }
  ]'
),
parsed(entries) AS (
  SELECT cast(json_parse(value) AS array(row(skuId varchar)))
  FROM data
)
SELECT ordinal, skuId
FROM parsed, UNNEST(entries) WITH ORDINALITY t(skuId, ordinal)

производит:

 ordinal |          skuId
---------+--------------------------
       1 | 5bc87ae20d298a283c297ca1
       2 | 182784738484wefhdchs4848
(2 rows)
...