Странный вывод csv при чтении файла csv из репозитория github с использованием pandas в ОС Debian - PullRequest
0 голосов
/ 02 апреля 2019

У меня есть следующие данные в CSV-файле:

XG,612.0
YG,-1924.0500000000002
ZG,-959.085
A_mod,6.889112523645457
I1_mod,0.478595694542785
I2_mod,32.64258822366686

Если я открою его с помощью Excel или Atom, все будет нормально. Файл находится в папке моего репозитория GitHub, я не знаю, важно ли это, но не должен, но когда я прочитал его с помощью функции pd.read_csv() на python, я получил следующий результат:

enter image description here

Кажется, что pandas читает какие-то метаданные из файла, но не сам файл. Я использую Python 3.6 от Jupyterlab на экземпляре виртуальной машины Debian Google Cloud. Я не думаю, что все это должно быть проблемой, но я впервые вижу, что это происходит, и я понятия не имею, что происходит.

Может кто-нибудь сказать мне, как решить эту проблему и объяснить, почему она вызвана?

Большое спасибо заранее.

EDIT

Файлы содержатся в локальной папке, клонированной через URL с сайта github. Поэтому использование git clone на вашем локальном компьютере должно дать тот же эффект.

В питоне я использую pd.read_csv('my_file.csv').

Еще одна любопытная вещь: на моем персональном компьютере под Windows 10 у меня нет проблем с чтением файлов. Но в экземпляре виртуальной машины Google Cloud, использующем ту же самую процедуру, у меня возникает эта странная проблема.

1 Ответ

1 голос
/ 02 апреля 2019

Вы смотрите на файл указателя Git LFS вместо реального файла. version, oid и size являются частями Git LFS spec . Git LFS хранит эти файлы вместо реальных больших файлов данных в хранилище. Они должны быть легко заменены при оформлении заказа.

Проверьте вывод git clone на поле, где вы получите неправильный результат. Кажется, есть проблема конфигурации с Git LFS.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...