Невозможно использовать файл выбора LabelEncoder в PowerBI - PullRequest
0 голосов
/ 18 февраля 2020

Я развертываю модель python в PowerBI. Тем не менее, я получаю ниже ошибки при работе в PowerBI. Я не получаю эту ошибку при использовании обучающих данных.

sklearn.exceptions.NotFittedError: ("This LabelEncoder instance is not fitted yet. Call 'fit' with appropriate arguments before using this method.", 'occurred at index Column1')

Я выполняю кодирование меток, как показано ниже.

from collections import defaultdict
d = defaultdict(LabelEncoder)
#With this, you now retain all columns LabelEncoder as dictionary.
# Encoding the variable
fit = df.apply(lambda x: d[x.name].fit_transform(x))
# Using the dictionary to label future data
df.apply(lambda x: d[x.name].transform(x))

И я сохраняю кодировщик с кодом ниже:

#Saving and loading a dictonary
import pickle
with open('filename.pickle', 'wb') as handle:
    pickle.dump(a, handle, protocol=pickle.HIGHEST_PROTOCOL)

Загрузка кодировщика этикеток, как показано ниже.

with open('filename.pickle', 'rb') as handle:
    b = pickle.load(handle)

Я кодирую невидимые категории в данных реального времени как «Недоступные», которые в настоящее время обрабатываются в наборе обучающих данных. Тот же код хорошо работает на наборе проверки, где я пытаюсь загрузить сохраненный LabelCoder и прогнозировать.

...