BigQuery предоставляет insertIds и выполняет некоторую дедупликацию, чтобы помочь в сценариях сбоев при вставке данных через API.Согласно документации, BigQuery запоминает вставку на срок до минуты , поэтому, если вставка не удалась, можно повторить вставку через API, не беспокоясь о возможном (вставленном) дублировании данных.Это может быть сложно, чтобы получить право .
Проблема в том, что в Google Cloud существует масса сервисов, которые обещают вставить данные в BigQuery.Например, DataFlow / Apache Beam является частью рекомендуемого стека для получения данных из многих источников в BigQuery.Есть также Dataprep, Stackdriver Logging и другие.
Так есть ли единый последовательный способ восстановления неудачных вставок в BigQuery при использовании произвольного стороннего клиента BigQuery, т.е. не API BigQuery?