вопрос по размеру образца Бернулли в aws Афина - PullRequest
0 голосов
/ 09 марта 2020

Я получаю случайную выборку Бернулли 1% из таблицы Афины. Однако размер возвращаемой таблицы сэмплов составляет всего 0,4% от исходной таблицы. Оба в паркетном формате. Почему это так?

1 Ответ

0 голосов
/ 12 марта 2020

Тогда опция Бернулли выберет строки с заданной вероятностью, только в среднем вы получите заданный процент выходных строк, но любой отдельный запрос будет иметь различное количество строк. Как правило, если в вашей таблице N строк, вы можете ожидать, что выходная таблица будет иметь количество строк от N +/- sqrt(N)

...