У меня есть команда Redshift COPY, которая импортирует данные за несколько дней в таблицу.Я пытаюсь создать таблицу данных, но у меня есть «эффективный» первичный ключ - IE не должно быть дубликатов идентификаторов в таблице - но затем сохранить данные, связанные с каждым идентификатором.
В настоящее время яЯ использую следующий запрос:
SELECT DISTINCT(a.uid),b.city FROM user_temp as a
INNER JOIN user_temp as b
ON a.uid = b.uid
Тем не менее, это возвращает несколько записей людей, где они существуют более одного раза в таблице user_temp.Я также попробовал:
SELECT DISTINCT * FROM user_temp
Однако в течение дня у идентификаторов есть данные, которые меняются.Меня интересует наличие только одной строки для каждого идентификатора с одним набором данных, связанных с ним.
В настоящее время импортируемые данные поступают так:
|UID | City |
|----|---------|
|1 | London|
|1 | York |
|2 | Derby |
|2 |Leicester|
С выходной таблицей, имеющейтолько один из каждого UID и любой из связанных с ним городов.