Моя встроенная модель слишком велика для загрузки в github, несмотря на то, что набор данных не очень большой - PullRequest
0 голосов
/ 26 сентября 2019

Я создаю модель с использованием Линейная регрессия , и после того, как я создаю файл из используемой модели, его размер превышает 400 МБ .Github допускает только файлы размером 100 Мб, поэтому я не могу зафиксировать и отправить данные, необходимые для использования Heroku.

Я в замешательстве, потому что форма моего тренировочного набора (3759, 10) , поэтому10 функций и 3759 наблюдений.

from sklearn.pipeline import make_pipeline
from sklearn.impute import SimpleImputer 
from sklearn.linear_model import LinearRegression
import category_encoders as ce

#Create pipelines for different regressors
linear_regression = make_pipeline(
  ce.OneHotEncoder(use_cat_names = True),
  SimpleImputer(),  
  LinearRegression()
)


#Fit Models!
linear_regression.fit(X_train,y_train)


#Create file out of model
from joblib import dump
dump(linear_regression, 'linear_regression.joblib')

После создания файла из модели я перенесу его в другую папку для использования в приложении.Будем весьма благодарны за любые предложения

1 Ответ

1 голос
/ 26 сентября 2019

Есть ли причина, по которой вы хотите использовать git для этого?Git обычно предназначен для хранения и обмена исходным кодом, а не выводами вашей программы.Если вы хотите сохранить это где-то для использования другим приложением, вы всегда можете попросить эту программу записать дамп в базу данных и загрузить приложение из этой базы данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...