Большие столбцы одноразового кодирования, массив ошибок линейной регрессии слишком велик;`arr.size * arr.dtype.itemsize` больше максимально возможного размера - PullRequest
0 голосов
/ 06 июня 2019

набор данных составляет около (45000,17000) с 16992 запасными столбцами [unit8,0] в результате однократного кодирования. затем попробуйте сделать sklearn.linear_model.linearRegression.

показывает ошибку:

ValueError: массив слишком большой; arr.size * arr.dtype.itemsize больше максимально возможного размера.

Есть ли способ уменьшить размер набора данных, как мне попробовать другой пакет LR?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...