Причина, по которой pandas игнорирует значения в .csv-файле? - PullRequest
0 голосов
/ 14 июля 2020

Я пытаюсь экспортировать фрейм данных pandas в csv, а затем снова пытаюсь прочитать csv в моей программе. В идеале фрейм данных должен быть точно таким же после его экспорта и чтения, и я хотел бы сохранить и заголовок, и индекс. Пытаясь сделать это, я обнаружил ошибку, я не совсем понимаю:

csv-файл сохранен отлично, но когда я вчитываю его в свою программу, файл "поврежден".

Я использую функции:

def SaveCSV(file,file_name,place,loc):
    file.to_csv(loc+place+'/'+file_name+'.csv', header=True, index=True)
def ExtractCSV(file_name,place,loc):
    file = pd.read_csv(loc+place+'/'+file_name+'.csv')
    return file

CSV должны быть сохранены в разных папках, поэтому аргумент place. Я уверен, что ошибка находится в строке file = pd.read_csv(loc+place+'/'+file_name+'.csv'), но я понятия не имею, что с этим делать.

Выходы до и после попытки чтения CSV, соответственно:

      Ticker  Cluster No.                Distances                Measure
BANF    BANF            2  [14.712, 14.271, 6.935]  [0.241, 0.248, 0.511]
PRI      PRI            2  [15.756, 13.244, 8.911]  [0.253, 0.301, 0.447]
MTLHF  MTLHF            2  [14.107, 14.502, 7.798]  [0.264, 0.257, 0.478]
MRCBF  MRCBF            2  [13.901, 14.219, 7.344]  [0.258, 0.253, 0.489]
NBL      NBL            0    [0.0, 13.625, 12.186]        [1.0, 0.0, 0.0]
OLN      OLN            1    [13.625, 0.0, 11.575]        [0.0, 1.0, 0.0]
KAR      KAR            2  [12.974, 12.691, 6.361]  [0.246, 0.252, 0.502]

И:

      Ticker  Cluster No.        Distances                Measure
BANF    BANF            0  [0.0, 0.0, 0.0]  [0.333, 0.333, 0.333]
PRI      PRI            0  [0.0, 0.0, 0.0]  [0.333, 0.333, 0.333]
MTLHF  MTLHF            0  [0.0, 0.0, 0.0]  [0.333, 0.333, 0.333]
MRCBF  MRCBF            0  [0.0, 0.0, 0.0]  [0.333, 0.333, 0.333]
NBL      NBL            0  [0.0, 0.0, 0.0]  [0.333, 0.333, 0.333]
OLN      OLN            0  [0.0, 0.0, 0.0]  [0.333, 0.333, 0.333]
KAR      KAR            0  [0.0, 0.0, 0.0]  [0.333, 0.333, 0.333]

Столбец «Тикер» оставлен без изменений, «Номер кластера» и «Расстояния» установлены на 0, «Измерение», кажется, установлено на среднее значение. Из-за несоответствия мне сложно локализовать проблему. Я искал решение или пример работающего csv-reader, но пока мне не повезло. Если я был полностью слеп к решению, пожалуйста, просветите меня (и я, кстати, знаю, что либо 1-й столбец, либо индекс могут быть исключены - работаю над этим).

Справочная информация: есть время потребляющие вычисления в фреймах данных, которые я пытаюсь экспортировать. Те, которые я хотел бы запустить в фоновом режиме, сохранив результаты как csv, которые я затем могу прочитать и выполнить (гораздо более быстрый) анализ сразу.

Edit: typos.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...