Google BigQuery всегда делит столбец на запятую - PullRequest
0 голосов
/ 15 декабря 2018

Я пытаюсь загрузить файл .csv в BigQuery с разделителем табуляции, и даже если я выберу "tab" в качестве пользовательского разделителя в настройках, он все равно будет разделен запятой.Я не могу понять, в чем проблема.Это из-за моего формата кортежа?Это мой формат данных:

time    zone_1  zone_2  zone_3

(18, 1, 1, 9)   (18, 360, 0.22) (193, 2702, 0.57)   (183, 7686, 0.14)

(18, 1, 1, 10)  (140, 5320, 0.51)   (138, 8280, 0.45)   (165, 6435, 0.23)

(18, 1, 1, 11)  (32, 448, 0.46)  (75, 1275, 0.57)   (90, 2610, 0.97)

(18, 1, 1, 12)  (117, 5382, 0.88)   (72, 2376, 0.72)    (119, 5593, 0.09)

, и это то, что я получаю после загрузки

big query columns

Ответы [ 2 ]

0 голосов
/ 03 января 2019

Вы должны гарантировать, что ваши данные разделены разделителем табуляции, некоторые текстовые редакторы заменяют пробелами другого типа;это может привести к тому, что Bigquery не найдет TAB, я предпочитаю использовать vi или vim из linux, чтобы убедиться в этом.

Затем вы можете запустить процесс импорта файла CSV в BigQuery .При выполнении следующих шагов учтите, что вы должны вручную указать имена столбцов, чтобы иметь возможность выбрать TAB в качестве разделителя.

Вот результат, который я получил:

enter image description here

При такой конфигурации:

enter image description here

0 голосов
/ 17 декабря 2018

Я нашел такой формат JSON, чтобы предоставить вам правильное решение

{"time":"(18, 1, 1, 9)","zone_1":"(18, 1, 1, 9)","zone_2":"(193, 2702, 0.57)","zone_3":"(183, 7686, 0.14)"}
{"time":"(18, 1, 1, 9)","zone_1":"(18, 1, 1, 9)","zone_2":"(193, 2702, 0.57)","zone_3":"(183, 7686, 0.14)"}

Это результат большого запроса после загрузки (Примечание: я предварительно определяю столбцы перед загрузкой и неиспользуйте опцию Автоматически определять)

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...