Как решить Неизвестный тип метки: «неизвестно» в деревьях решений Python - PullRequest
0 голосов
/ 18 мая 2019

Я новичок в принятии решения и пытаюсь составить дерево решений из фрейма данных Review, который пока имеет оценки. Я пробовал это, но он дает мне

X = ndf.drop('Score', axis=1) 
y = ndf['Score'] 
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.30)
model = tree.DecisionTreeClassifier()
model.fit(X_train, y_train)

все значения в ndf ['Score'] равны 1 или 0. И я получаю сообщение об ошибке Неизвестный тип метки: 'unknown', когда я пытаюсь запустить последнюю строку. Как я могу решить это?

1 Ответ

0 голосов
/ 18 мая 2019

Убедитесь, что все ваши ярлыки (y_train и y_test) относятся только к одному типу (int или string).

Для вашего случая int может быть подходящим типом для метки, преобразуйте его в int, если вы видите, что тип Score равен object, когда вы делаете ndf.info()

# Add below line to convert the typt to `int`
xdf['Score'] = xdf['Score'].astype('int')

# Your code should be working fine now
X = ndf.drop('Score', axis=1) 
y = ndf['Score'] 
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=42, test_size=0.30)
model = tree.DecisionTreeClassifier()
model.fit(X_train, y_train)

В общем, мы всегда должны применять соответствующий тип для столбцов, а не только для DecisionTreeClassifier.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...