Я пытаюсь экспортировать фрейм данных pandas в csv, а затем снова пытаюсь прочитать csv в моей программе. В идеале фрейм данных должен быть точно таким же после его экспорта и чтения, и я хотел бы сохранить и заголовок, и индекс. Пытаясь сделать это, я обнаружил ошибку, я не совсем понимаю:
csv-файл сохранен отлично, но когда я вчитываю его в свою программу, файл "поврежден".
Я использую функции:
def SaveCSV(file,file_name,place,loc):
file.to_csv(loc+place+'/'+file_name+'.csv', header=True, index=True)
def ExtractCSV(file_name,place,loc):
file = pd.read_csv(loc+place+'/'+file_name+'.csv')
return file
CSV должны быть сохранены в разных папках, поэтому аргумент place
. Я уверен, что ошибка находится в строке file = pd.read_csv(loc+place+'/'+file_name+'.csv')
, но я понятия не имею, что с этим делать.
Выходы до и после попытки чтения CSV, соответственно:
Ticker Cluster No. Distances Measure
BANF BANF 2 [14.712, 14.271, 6.935] [0.241, 0.248, 0.511]
PRI PRI 2 [15.756, 13.244, 8.911] [0.253, 0.301, 0.447]
MTLHF MTLHF 2 [14.107, 14.502, 7.798] [0.264, 0.257, 0.478]
MRCBF MRCBF 2 [13.901, 14.219, 7.344] [0.258, 0.253, 0.489]
NBL NBL 0 [0.0, 13.625, 12.186] [1.0, 0.0, 0.0]
OLN OLN 1 [13.625, 0.0, 11.575] [0.0, 1.0, 0.0]
KAR KAR 2 [12.974, 12.691, 6.361] [0.246, 0.252, 0.502]
И:
Ticker Cluster No. Distances Measure
BANF BANF 0 [0.0, 0.0, 0.0] [0.333, 0.333, 0.333]
PRI PRI 0 [0.0, 0.0, 0.0] [0.333, 0.333, 0.333]
MTLHF MTLHF 0 [0.0, 0.0, 0.0] [0.333, 0.333, 0.333]
MRCBF MRCBF 0 [0.0, 0.0, 0.0] [0.333, 0.333, 0.333]
NBL NBL 0 [0.0, 0.0, 0.0] [0.333, 0.333, 0.333]
OLN OLN 0 [0.0, 0.0, 0.0] [0.333, 0.333, 0.333]
KAR KAR 0 [0.0, 0.0, 0.0] [0.333, 0.333, 0.333]
Столбец «Тикер» оставлен без изменений, «Номер кластера» и «Расстояния» установлены на 0, «Измерение», кажется, установлено на среднее значение. Из-за несоответствия мне сложно локализовать проблему. Я искал решение или пример работающего csv-reader, но пока мне не повезло. Если я был полностью слеп к решению, пожалуйста, просветите меня (и я, кстати, знаю, что либо 1-й столбец, либо индекс могут быть исключены - работаю над этим).
Справочная информация: есть время потребляющие вычисления в фреймах данных, которые я пытаюсь экспортировать. Те, которые я хотел бы запустить в фоновом режиме, сохранив результаты как csv, которые я затем могу прочитать и выполнить (гораздо более быстрый) анализ сразу.
Edit: typos.