Проблема с отображением данных из RandomForest с мультиклассом - PullRequest
0 голосов
/ 12 мая 2019

Так что я использую классификацию текста для классификации диалектов, и мне нужно построить кривые точности-отзыва и ROC, приведенный ниже код является начальными настройками для построения графика, как было дано в ответе в этом посте: Как построить точностьи вспомнить мультиклассовый классификатор?

n_classes = len(set(all_data['dialect']))

Y = label_binarize(all_data['dialect'], classes=[*range(n_classes)])

X_train, X_test, y_train, y_test = train_test_split(all_data['tweets'],Y,
                                                    random_state = 42)

clf = OneVsRestClassifier(RandomForestClassifier(n_estimators=50,
                             max_depth=3,
                             random_state=0))
clf.fit(X_train, y_train)

y_score = clf.predict_proba(X_test)

И я получаю предупреждения примерно так:

UserWarning: Label not 0 is present in all training examples.
UserWarning: Label not 1 is present in all training examples.
UserWarning: Label not 2 is present in all training examples.

Когда я продолжал строить график с остальной частью кода, график былпустой.

...