Я пытаюсь загрузить CSV-файл в Bigquery, но получаю следующую ошибку:
Error: Bad character (ASCII 0) encountered (bigquery)
Я пробовал следующее, но ничего из этого не работает:
а) Откройте файл и сохраните его как «UTF-8» в блокноте.
б) Откройте файл в блокноте ++ и используйте опцию «Искать символы по типу» - не ASCII. Не нашел ни одного символа c) Используйте блокнот ++ со следующими регулярными выражениями, не нашел ни одного символа:
[^\x00-\x7F] and [^\x1F-\x7F].
d) Используйте следующую команду:
gsutil cp gs://bucket_987234/compress_file.gz - | gunzip | tr -d '\000' | gsutil cp - gs://bucket_987234/uncompress_and_clean_file
Не сработало: «tr» не распознается как команда (я использую windows 10 и у меня нет доступа к виртуальной машине Google).
d ) Открыл файл и удалил первую строку, потом все заработало. Но я потерял строку данных, а у меня тысячи файлов.
Проблема в том, что мне нужно автоматизировать «очистку» этих файлов. Как я могу очистить этот файл в Windows, есть идеи, что еще может этот символ «ASCII 0» или как от него избавиться?
Спасибо !!