Использование NOT IN для нескольких столбцов в Clickhouse - PullRequest
0 голосов
/ 01 октября 2019

У меня есть таблица, которая будет иметь данные следующим образом

идентификатор, адрес электронной почты, имя файла

1, abc, file1

2, abc, file1

1, abc, file2

1, abc, file3


Мне нужны уникальные имена пользователей для файлов.

Мне нужен запростаким образом, что данные, содержащиеся в файле, не должны содержаться в других файлах.

Например:

file1 имеет два разных идентификатора, в этом случае у него будет 2 уникальных пользователя.

данные file2 - это те же данные, что и file1, поэтому число уникальных пользователей должно быть 0

file3 имеет другой адрес электронной почты, поэтому он должен иметь 1 уникального пользователя

Файл должен иметь по крайней мере идентификатор или адрес электронной почты, отличный отдругие файлы для расчета как уникальный пользователь

...