У меня есть примерное изображение набора данных и ожидаемый результат. Что может быть лучшим способом достижения такого результата в наборе данных с миллиардом записей.
Должны ли мы использовать промежуточные временные таблицы или в 1 Query.
Req: -
Получить все записи для SN, которые имеют более 2 записей в таблице и показать только записи, где цена составляет 100
CREATE TABLE test(
`sn` string,
`itemA` string,
`itemB` string,
`price` int)
insert into table test values ('1','A','D',100),('1','B','E',100),('1','C','F',200),('2','A','D',100),('2','C','F',200);