Сообщение об ошибке появляется каждый раз в python sklearn - PullRequest
0 голосов
/ 12 января 2019

Я пишу опорную векторную машину на python, используя sklearn. Однако при каждом запуске программы возникает ошибка. Я перепробовал много методов, но они не помогли.

Дело в том, что мой источник (функция) уже предоставлен, но не установлен мной.

Ошибка «По крайней мере, одна указанная метка должна быть в y_true» Я не знаю, что это значит. Я перепробовал все методы в интернете. Все они сложны, и я не знаю, как реализовать в моей программе.

from sklearn.metrics import classification_report, confusion_matrix
import itertools
yhat = clf.predict(X_test)
def plot_confusion_matrix(cm, classes,
                      normalize=False,
                      title='Confusion matrix',
                      cmap=plt.cm.Blues):

    if normalize:
        cm = cm.astype('float') / cm.sum(axis=1)[:, np.newaxis]
        print("Normalized confusion matrix")
    else:
        print('Confusion matrix, without normalization')

    print(cm)

    plt.imshow(cm, interpolation='nearest', cmap=cmap)
    plt.title(title)
    plt.colorbar()
    tick_marks = np.arange(len(classes))
    plt.xticks(tick_marks, classes, rotation=45)
    plt.yticks(tick_marks, classes)

    fmt = '.2f' if normalize else 'd'
    thresh = cm.max() / 2.
    for i, j in itertools.product(range(cm.shape[0]), range(cm.shape[1])):
        plt.text(j, i, format(cm[i, j], fmt),
                 horizontalalignment="center",
                 color="white" if cm[i, j] > thresh else "black")

    plt.tight_layout()
    plt.ylabel('True label')
    plt.xlabel('Predicted label')

cnf_matrix = confusion_matrix(y_test, yhat, labels=[2,4])

np.set_printoptions(precision=2)

print (classification_report(y_test, yhat))

plt.figure()
plot_confusion_matrix(cnf_matrix, classes= 
['Benign(2)','Malignant(4)'],normalize= False,  title='Confusion matrix')

Я ожидаю, что будет показана вся картина, но не будет ошибки. Пожалуйста, помогите.

Сообщение об ошибке:

 ValueError                                Traceback (most recent call last)
 <ipython-input-28-2fde8d1a966e> in <module>()
----> 1 cnf_matrix = confusion_matrix(y_test, yhat, labels=[2,4])
      2 
      3 np.set_printoptions(precision=2)
      4 
      5 print (classification_report(y_test, yhat))

 /opt/conda/envs/DSX-Python35/lib/python3.5/site-packages/sklearn/metrics/classification.py in confusion_matrix(y_true, y_pred, labels, sample_weight)
     257         labels = np.asarray(labels)
     258         if np.all([l not in y_true for l in labels]):
 --> 259             raise ValueError("At least one label specified must be in y_true")
     260 
     261     if sample_weight is None:

 ValueError: At least one label specified must be in y_true
...