У меня есть приложение для обмена сообщениями, которое регулярно вставляет повторяющиеся сообщения в BigQuery. Имя таблицы 'метрики' , и в ней есть следующие поля: введите описание изображения здесь
Столбец Row - это большой запрос ROW_NUMBER (), который не является частью таблицы metrics . Все остальные столбцы, кроме batch_id , образуют 2 повторяющиеся строки для каждого message_id . Вы можете видеть, что message_id повторяется дважды, и для каждой вставки создается 1 другой batch_id.
Мне нужен такой вывод, только 3 строк должны быть в выбранном результате с 3 разными message_id вместо 6 строк, которые я здесь получаю. Было бы лучше, если бы была выбрана строка, которая была вставлена первой среди дубликатов для каждого идентификатора сообщения (поскольку start_time и end_time одинаковы для дубликатов, я не уверен, как чтобы найти это). Я новичок в Bigquery, видел несколько примеров в sql, но не в Bigquery, поэтому любая помощь приветствуется
Спасибо за вашу помощь.