Как избежать масштабирования / копирования данных в Scikit-Learn Logisti c Fit регрессии () для плотных входных данных - PullRequest
0 голосов
/ 17 апреля 2020

У меня большой набор входных данных типа float16. Мои данные плотные, а не разреженные.

Я использую класс Sklearn LogisticRegression для подгонки модели к этим данным.

Недостаточно памяти во время подбора модели.

I Полагаю, что fit () будет повышен до float32 или float64, в зависимости от используемого решателя и / или версии sklearn.

Есть ли способ, которым я могу избежать этого дополнительного копирования данных и / или масштабирования?

Будет ли масштабирование входных данных самостоятельно до float64, чтобы избежать копирования данных?

Мои предпочтения использовать либлинейный решатель, но рассмотрим lbfgs или сагу.

Я бы предпочел не использовать градиентный спуск.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...