Причины ошибки памяти. Numpy деление на стандартное отклонение - PullRequest
0 голосов
/ 24 марта 2020

Я пытаюсь нормализовать мой тренировочный и тестовый набор для набора данных MNIST. Вот мой код

import numpy as np
import pandas as pd

prediction = pd.read_csv("sample_submission.csv")
test_csv = pd.read_csv("test.csv")
train_csv = pd.read_csv("train.csv")

train = train_csv.values.T  # turn train set data frame to numpy array
test = test_csv.values.T
y_values = train[[0], :]  # bring y values  [3,1,4,6,2,0,...]
train = train[1:, :]

y = np.zeros((10, y_values.shape[1]))
for i in range(y_values.shape[1]):
    y[y_values[0][i]][i] = 1  # one-hot encoding

# scaling data set values to range (0,1)
train = np.divide(train, np.std(train))
test = np.divide(test, np.std(test))

, кажется, все работает, за исключением того, что в последней части мне выдается ошибка памяти, когда я пытаюсь разделить тестовый набор со стандартным отклонением.

Traceback (most recent call last):
  File "C:/Users/falco/PycharmProjects/Digit-Recognizer/main.py", line 26, in <module>
    test = np.divide(test, np.std(test))
  File "C:\Users\falco\Anaconda3\lib\site-packages\numpy\core\fromnumeric.py", line 3242, in std
    **kwargs)
  File "C:\Users\falco\Anaconda3\lib\site-packages\numpy\core\_methods.py", line 140, in _std
    keepdims=keepdims)
  File "C:\Users\falco\Anaconda3\lib\site-packages\numpy\core\_methods.py", line 117, in _var
    x = asanyarray(arr - arrmean)
MemoryError

Любая помощь / идеи о том, почему это происходит, будет принята с благодарностью!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...