У меня есть пример dict, начинающийся как этот
{'first': {'second': [],
'third': 1.0,
'fourth': {'fifth': 'test', 'value': 2.0},
'sixth': {'seventh': 3.0,
'eight': 4.0,
Я пробовал это
y_test = np.array([x['first']['sixth'] == 'seventh' for x in test_data])
когда
test = LogisticRegression(class_weight='balanced').fit(X_test, y_test)
но продолжайте получать
ValueError : этому решающему устройству требуются как минимум 2 класса в
данные, но данные содержат только один класс: False
Примечание : ячейки 4 и 7 из записная книжка
изменить: я изменил на
y_test = np.array([x['first']['sixth'] == 'seventh' for x in test_data], dtype=float)
и теперь проблема в
ValueError: Unknown label type: 'continuous'
для которого я использовал кодировку метки
import numpy as np
from sklearn import metrics, svm
from sklearn.linear_model import LogisticRegression
from sklearn import preprocessing
from sklearn import utils
lab_enc = preprocessing.LabelEncoder()
training_scores_encoded = lab_enc.fit_transform(y_test)
, который идет в мультикласс
или svc, чтобы держать поплавки
from sklearn.svm import SVR
svr = SVR()
sld = svr.fit(x_test, y_test)
но оба они занимают много времени
использование dtype = int занимает 8 минут на GPU T4
но результаты имеют много шума и проблем с идентичностью