Мои коды, использующие pandas.dataframe.nlargest (), возвращают ошибку памяти - PullRequest
0 голосов
/ 15 мая 2019

Я пытаюсь найти лучшие n значений из моего кадра данных панд.(исходные данные около 2000 * 2000 idx * размер столбца)

Возвращается ошибка памяти.

Даже не уверен, что именно означает моя ошибка.Пытался зайти в Google, но пока не смог найти ту же проблему

X = int(input())
TopX = CorrVal.stack().nlargest(X)

(данные CorrVal - это значение корреляции между суммой продаж товара). Поэтому я хочу иметь n самых верхних значений корреляции

item01 item02 0.744
item05 item04 0.689
item04 item03 0.554
...    ...    ...

Коды ошибок ниже

TopX = CorrVal.stack().nlargest(X)  

Файл "C: \ Users \ 2F4 \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib \ site-packages \ pandas \ core \ series.py ", строка 3120, в самых длинных алгоритмах возврата. ВыборNSeries (self, n = n, keep = keep) .nlargest () Файл" C: \ Users \ 2F4 \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib\ site-packages \ pandas \ core \gorithms.py ", строка 1058, в самом верхнем возвращаемом файле self.compute ('nlargest')" C: \ Users \ 2F4 \ AppData \ Local \ Programs \ Python \ Python36-32 \ lib\ site-packages \ pandas \ core \gorithms.py ", строка 1124, в вычислении kth_val = algos.kth_smallest (arr.copy (), n - 1) MemoryError

Какие функции илиинструменты можно использовать для решения этой проблемы?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...