Создание временной таблицы уникальных первичных ключей и 1 набора связанных значений для каждого - PullRequest
0 голосов
/ 09 июля 2019

У меня есть команда Redshift COPY, которая импортирует данные за несколько дней в таблицу.Я пытаюсь создать таблицу данных, но у меня есть «эффективный» первичный ключ - IE не должно быть дубликатов идентификаторов в таблице - но затем сохранить данные, связанные с каждым идентификатором.

В настоящее время яЯ использую следующий запрос:

SELECT DISTINCT(a.uid),b.city FROM user_temp as a
INNER JOIN user_temp as b
ON a.uid = b.uid

Тем не менее, это возвращает несколько записей людей, где они существуют более одного раза в таблице user_temp.Я также попробовал:

SELECT DISTINCT * FROM user_temp

Однако в течение дня у идентификаторов есть данные, которые меняются.Меня интересует наличие только одной строки для каждого идентификатора с одним набором данных, связанных с ним.

В настоящее время импортируемые данные поступают так:

|UID |  City   |
|----|---------|
|1   |   London|
|1   |   York  |
|2   |   Derby |
|2   |Leicester|

С выходной таблицей, имеющейтолько один из каждого UID и любой из связанных с ним городов.

...