Мне интересно, возможно ли сделать приблизительный отчет следующим образом:
1. У меня есть такая агрегация:
country unique products sold helper_data -- limit 1MB size
US 100,000,005 ??
CA 192,394,293 ??
2. И мне интересно, смогу ли я получить следующее:
country unique products sold
[ALL] 205,493,599 # possible to get this??
US 100,000,005
CA 192,394,293
Другими словами, без передачи всех значений (их слишком много, и у меня недостаточно памяти для их обработки), может быть передан какой-то хэш (или что-то еще) для каждой позиции, специфичной для территории , чтобы приблизиться к тому, что приблизительное различное количество было бы, когда сложено вместе между несколькими пунктами? Или это невозможно сделать.
Обратите внимание, что я не ищу SQL-подход, мне просто интересно посмотреть, возможно ли передать какой-то объект / хэш / и т.д. вернуться к каждой позиции, а затем построить приблизительный уникальный счетчик по нескольким позициям.