Я пытаюсь загрузить JSON в BigQuery с --autodetect
, поэтому мне не нужно вручную обнаруживать и выписывать всю схему. Строки JSON не все имеют одинаковую форму, поэтому поля вводятся в более поздние строки, которых нет в более ранних строках.
К сожалению, я получаю следующую ошибку:
Upload complete.
Waiting on bqjob_r1aa6e3302cfc399a_000001712c8ea62b_1 ... (1s) Current status: DONE
BigQuery error in load operation: Error processing job '[...]:bqjob_r1aa6e3302cfc399a_000001712c8ea62b_1': Error while reading data, error message: JSON table encountered too many errors, giving up.
Rows: 1209; errors: 1. Please look into the errors[] collection for more details.
Failure details:
- Error while reading data, error message: JSON processing
encountered too many errors, giving up. Rows: 1209; errors: 1; max
bad: 0; error percent: 0
- Error while reading data, error message: JSON parsing error in row
starting at position 829980: No such field:
mc.marketDefinition.settledTime.
Вот данные, которые я загружаю: https://gist.github.com/max-sixty/c717e700a2774ba92547c7585b2b21e3
Может быть, при автоопределении используются первые n строк, а затем происходит сбой, если строки после n отличаются? Если это так, есть ли способ решить эту проблему?
Можно ли использовать какой-либо инструмент для извлечения схемы из всего файла и последующей явной передачи BigQuery?