Tensorflow OneHotEncoder на большой файл для линейной регрессии - PullRequest
0 голосов
/ 11 июля 2019

Мне нужно запустить простую линейную регрессию для большого набора данных 30 ГБ, который не может быть загружен в память.Особенности в основном категориальные данные.Я уже создал прототип в Scikit-Learn, который работает просто отлично, но работает только с подвыборкой данных.Я посмотрел вокруг, не нашел много, что может повторить поведение CountVectorizer в Scikit-Learn.

...