У меня огромный набор данных с более чем 300 столбцами, и, поскольку 90% этих столбцов являются категоричными по своей природе, я решил быстро их кодировать, что привело к набору данных формы (466557, 1778). Я пытаюсь масштабировать эти данные, используя:
from sklearn import preprocessing as p
scaler = p.StandardScaler()
df_ss = scaler.fit_transform(df)
Однако я сталкиваюсь с ошибкой памяти.
MemoryError Traceback (most recent call last)
<ipython-input-92-d766bc7d2870> in <module>()
Как я могу предотвратить это?