Как исправить загрузку CSV-файла в BigQuery с помощью Python - PullRequest
0 голосов
/ 07 января 2019

при загрузке CSV-файла в BigQuery через хранилище я получаю сообщение об ошибке ниже: Таблица CSV обнаружила слишком много ошибок, отказываясь. Ряды: 5; ошибки: 1. Пожалуйста, просмотрите поток ошибок для более подробной информации.

В схеме я использую все параметры в качестве строки.

В CSV-файле у меня есть данные ниже:

Время пришло. Скажите «Я делаю» в моем стиле.

Я не могу загрузить CSV-файл в BigQuery, содержащий приведенное выше предложение

Ответы [ 2 ]

0 голосов
/ 08 января 2019

Спасибо всем за ответ.

Вот мое решение этой проблемы:

с открытым ('/ path / to / csv / file', 'r') как f: text = f.read ()

convert_text = text.replace ('"'," '") print (convert_text)

с открытым ('/ path / to / csv / file', 'w') как f: f.write (converted_text)

0 голосов
/ 07 января 2019

Имеет ли файл CSV ту же структуру, что и схема набора данных? Оба должны совпадать, чтобы загрузка была успешной.

Если ваш CSV-файл содержит только одно предложение в первой строке первого столбца, то ваша схема должна иметь таблицу с ровно одним полем как STRING. Если во втором столбце CSV есть содержимое, схема должна иметь для него второе поле и т. Д. И наоборот, если ваша схема имеет, например, 2 поля, заданных как STRING, в CSV должны быть данные в первых двух столбцах.

Расположение данных также должно совпадать, если ваш набор данных BigQuery находится в США, значит, ваше хранилище облачного хранилища должно быть в США, чтобы загрузка работала.

Проверьте здесь для получения подробной информации о загрузке CSV в BigQuery.

...