Прогнозирование с использованием данных о местоположении - PullRequest
0 голосов
/ 14 апреля 2020

Я пытаюсь разработать часть кода, которая помогает мне прогнозировать продуктивность нового ресурса в банке на основе существующей производительности, т. Е. (Количество счетов, открытых за последние 12 месяцев / 12 месяцев) существующих ресурсов в конкретном городской филиал в банке. Например, если я хочу нанять новый ресурс в Агре, эта модель может подсказать мне существующую производительность в филиале Агры.

Ниже приведена ссылка на мой блокнот python. Записная книжка

Я пробовал модель KNN для прогнозирования данных, однако точность модели очень низкая.

Был бы лучший способ прогнозировать данные с учетом Название филиала или координаты его расположения?

Использую Python 3.6 блокнот

1 Ответ

0 голосов
/ 14 апреля 2020

Вы пытаетесь предсказать вывод числовых значений c, поэтому ваша проблема - это регрессия , , а не классификация. Классификаторы не будут работать, ни точность не является правильным показателем производительности здесь.

Вам необходимо использовать показатель производительности c, подходящий для регрессии - см. Список в документации ; предполагая, что вы хотите использовать среднюю абсолютную ошибку (MAE), вы должны изменить свое обучение l oop на:

from sklearn.neighbors import KNeighborsRegressor
from sklearn.metrics import mean_absolute_error

#Train Model and Predict  
neigh = KNeighborsRegressor(n_neighbors = n).fit(X_train,y_train)
yhat=neigh.predict(X_test)
err[n-1] = mean_absolute_error(y_test, yhat)

и иметь в виду, что MAE - это ошибка metri c, т.е. лучше, и вы предустановили err таким же образом, как ваш mean_acc,

...