Какое ограничение на Google BigQuery? Я пытаюсь выполнить оператор SQL для примерно 6 ГБ данных, но, похоже, это занимает много времени (более часа), а затем, когда я вернулся, чтобы проверить его через полдня, я обнаружил ошибку " истекло время ожидания запроса. повторите попытку ".
Я предполагаю, что 6 ГБ данных не слишком много по сравнению с тем, что могли бы иметь другие люди, но меня удивляет, что я рассчитываю на подобное. Если это помогает, мой SQL-запрос немного сложен и, по сути, вычисляет уникальное число скользящего окна, что, как я считаю, обычно занимает много времени. Я также проверил, чтобы добавить в таблицу назначения и «разрешить большие результаты».
Кроме того, я запускаю запрос в самом редакторе запросов Google BigQuery (где написано Compose Query).
РЕДАКТИРОВАТЬ: (ниже фактический запрос, который я использую)
SELECT t1.time, t1.x, COUNT(DISTINCT t2.x)
FROM `data` AS t1
JOIN `data` AS t2 ON t2.time
BETWEEN TIMESTAMP_SUB(t1.time, INTERVAL 1 HOUR) AND t1.time
GROUP BY t1.time, t1.x
Вот некоторые примеры данных:
X
05:20:19 4 <- 2 (4 and 5 are unique)
05:20:19 5 <- 2 (4 and 5 are unique) * same time as before
05:37:18 7 <- 3 (4, 5 and 7 are unique)
05:45:14 4 <- 3 (4, 5, and 7)
05:56:04 4 <- 3 (4, 5, and 7)
06:18:48 6 <- 4 (now 4, 5, 6, and 7)
06:48:34 3 <- 3 (only checks past hour, so now 3, 4, 6)
07:52:48 1 <- 1 (only time in past hour, so only 1)
У меня есть около 6 ГБ этих данных
Спасибо!