ValueError: Неизвестный тип метки: «unknown» при использовании KNN - PullRequest
0 голосов
/ 28 июня 2019

Я новичок в python и пытаюсь запустить KNN, но когда я ввожу код, я получаю ошибку ValueError: Unknown type label: 'unknown'.Я закодировал все категориальные данные и отбросил те, которые мне не нужны, чтобы избежать фиктивной ловушки.Что еще мне нужно сделать, чтобы очистить это?

from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import fbeta_score

training_accuracy = []
test_accuracy = []    
neighbors_settings = range(1, 11)

for n_neighbors in neighbors_settings:
     knn = KNeighborsClassifier(n_neighbors=n_neighbors)
     knn.fit(x_train, y_train)
     train_pred=knn.predict(x_train)
     test_pred=knn.predict(x_test)   

training_accuracy.append(fbeta_score(y_train, train_pred, beta=1))
test_accuracy.append(fbeta_score(y_test, test_pred, beta=1))

plt.plot(neighbors_settings, training_accuracy, label="training accuracy")
plt.plot(neighbors_settings, test_accuracy, label="test accuracy")
plt.ylabel("Accuracy")
plt.xlabel("n_neighbors")
plt.legend()
plt.savefig('knn_compare_model')

Я ожидаю, что график покажет точность теста и точность обучения, но я получу это ниже;

 ValueError                                Traceback (most recent call last)
<ipython-input-22-8a3a1f3c5c24> in <module>

    11     # build the model    
    12     knn = KNeighborsClassifier(n_neighbors=n_neighbors)     
---> 13     knn.fit(x_train, y_train)
>
    14     
    15     # if accuracy of prediction on training set is high but it is low 
           on test set: So overfitting     

C:\ProgramData\Anaconda3\lib\site-packages\sklearn\neighbors\base.py in fit(self, X, y)
    903             self.outputs_2d_ = True    
    904     
    --> 905         check_classification_targets(y)
    906         self.classes_ = []   
    907         self._y = np.empty(y.shape, dtype=np.int)    
>
C:\ProgramData\Anaconda3\lib\site-packages\sklearn\utils\multiclass.py in 
   check_classification_targets(y)
    169     if y_type not in ['binary', 'multiclass', 'multiclass- multioutput', 
    >
    170                       'multilabel-indicator', 'multilabel-sequences']:    
    --> 171         raise ValueError("Unknown label type: %r" % y_type)
    >
    172    
    173    

ValueError: Unknown label type: 'unknown'

1 Ответ

0 голосов
/ 04 июля 2019

Ваш y_train может иметь тип объекта, который может вызвать эту ошибку, поэтому, пожалуйста, добавьте строку

y_train = y_train.astype('int')

до

knn.fit(x_train, y_train)

Также сделайте то же самое с вашим y_test.

Надеюсь, это поможет!

...