Vertica: разбирать строку как JSON при вставке данных из таблицы в flextable - PullRequest
2 голосов
/ 20 июня 2019

Я использую Vertica 9.2.1 в EON-режиме. У меня есть таблица фактов со столбцом, содержащим строки JSON. Я хочу загрузить эти данные вместе с некоторыми идентификаторами из таблицы фактов в гибкую таблицу. Так что мы можем провести анализ этих данных. Чего я хочу избежать, так это загружать все необходимые данные на компьютер ETL для преобразования данных, а затем загружать их в гибкую таблицу, поскольку все данные уже доступны в Vertica. Как я могу сказать Vertica проанализировать столбец VARCHAR как JSON?

CREATE TABLE public.tmp_facts ("id" INTEGER, "user_id" VARCHAR(64), "event_type" VARCHAR(50), /* other columns omitted */ "additional" VARCHAR(65000));
INSERT INTO public.tmp_facts ("id", "user_id", "event_type", "additional")
SELECT 1, 'user1', 'event1', '{"os":"Android", "time":"'||NOW()||'"}';
CREATE FLEX TABLE public.fact_additional
(
    "id" INTEGER NOT NULL,
    "user_id" VARCHAR(64) NOT NULL,
    "event_type" VARCHAR(50)
);
INSERT INTO public.fact_additional ("id", "user_id", "event_type")
SELECT "id", "user_id", "event_type", "additional" FROM tmp_facts;

SELECT "additional", "additional.os", "additional[os]" FROM fact_additional;

Я ожидал, что последний запрос выведет хотя бы один столбец Android

1 Ответ

2 голосов
/ 21 июня 2019

Вам нужно передать столбец additional через функцию MapJSONExtractor() при вставке из public.tmp_facts в public.fact_additional

INSERT INTO public.fact_additional ("id", "user_id", "event_type")
SELECT "id",
       "user_id",
       "event_type", 
       MapJSONExtractor("additional") as additional 
FROM tmp_facts;

SELECT "additional"['os'] as os FROM fact_additional;

   os    
---------
 Android
(1 row)

Обратите внимание на использование одинарных / двойных кавычек в соответствующих местах.

...