Как я могу загрузить электронную таблицу XLSX с 52,4 МБ в BigQuery? - PullRequest
0 голосов
/ 27 мая 2019

Я пытаюсь проанализировать миллионы поисковых запросов в интернет-магазине и объединить их в Google Data Studio.К сожалению, XLSX в моем облачном хранилище Google из-за ошибок:

Ошибка при чтении данных, сообщение об ошибке: таблица CSV обнаружила слишком много ошибок, отказывает.Ряды: 1;ошибки: 1. Пожалуйста, обратитесь к коллекции ошибок [] для получения более подробной информации.

Ошибка при чтении данных, сообщение об ошибке: Обнаружена ошибка при разборе строки, начинающейся с позиции: 0. Ошибка: обнаружен плохой символ (ASCII 0).

Я загрузил файл XLSX со своего компьютера в облачное хранилище Google и попытался создать из него таблицу с помощью Google BigQuery, и при импорте я получаю эти сообщения об ошибках.

Iхочу использовать BigQuery в качестве источника данных для моей Google Data Studio и объединить строки поиска из файла XLSX таким образом, чтобы я мог видеть, какие запросы выполняются регулярно без каких-либо результатов, а какие строки поиска ищутся чаще всего.

Я был бы очень признателен вам за помощь в устранении ошибки и поиске эффективного способа агрегирования данных без необходимости в длительном времени загрузки.

1 Ответ

0 голосов
/ 28 мая 2019

Поддерживаемые форматы данных не включают XLSX.

Хороший способ добиться этого - преобразовать XLSX в CSV, а затем загрузить его в BigQuery.

Здесь у вас есть пример того, как использовать Python с пандами для преобразования файла. После преобразования вы можете загрузить его в Google Cloud Storage, а затем загрузить в BigQuery.

Кроме того, вы можете загрузить его прямо со своего компьютера , не используя Google Cloud Storage.

...