У меня есть случайный классификатор леса, хранящийся в объекте clf
. В действительно упрощенных терминах я сделал следующее:
# Import libraries
import pandas as pd
from import sklearn.ensemble import RandomForestClassifier as rfc
# Import data
exog = pd.read_csv('train.csv')
trgt = pd.read_csv('target.csv')
# Declare classifier
clf = rfc(n_estimators=51, bootstrap=True, max_features=3)
# Fit classifier to data
clf.fit(exog, trgt)
Я хотел бы экспортировать clf
, чтобы я мог ссылаться на него в другом скрипте. Моя цель - импортировать clf
в Python скрипт, который будет работать на удаленном сервере. Я хочу ввести в него данные вне выборки и вернуть их соответствующие баллы, используя clf.predict_proba(new_data)
.
Мой главный приоритет - избегать обучения классификатора каждый раз, когда я предсказываю вероятности для новых наборов данных. Есть ли способ экспортировать настроенный объект clf
?
Этот поток указал мне правильное направление, но решение использует cPickle и выдает следующую ошибку:
Ошибка типа: аргумент write () должен быть str, а не байтами