Так что я использую классификацию текста для классификации диалектов, и мне нужно построить кривые точности-отзыва и ROC, приведенный ниже код является начальными настройками для построения графика, как было дано в ответе в этом посте: Как построить точностьи вспомнить мультиклассовый классификатор?
n_classes = len(set(all_data['dialect']))
Y = label_binarize(all_data['dialect'], classes=[*range(n_classes)])
X_train, X_test, y_train, y_test = train_test_split(all_data['tweets'],Y,
random_state = 42)
clf = OneVsRestClassifier(RandomForestClassifier(n_estimators=50,
max_depth=3,
random_state=0))
clf.fit(X_train, y_train)
y_score = clf.predict_proba(X_test)
И я получаю предупреждения примерно так:
UserWarning: Label not 0 is present in all training examples.
UserWarning: Label not 1 is present in all training examples.
UserWarning: Label not 2 is present in all training examples.
Когда я продолжал строить график с остальной частью кода, график былпустой.