Я пытаюсь передать массив feature
и label
numpy в train_test_split
.Объекты представляют собой один столбец (дата-время dtype преобразуется в целое число).В массиве labels
имеется 900 наблюдений.
features.shape
возвращает (1101, 1)
labels.shape
возвращает (1101, 900)
Перед разбиением на массивы объектов и метокЯ сделал df.fillna(0, inplace=True)
, потому что я думал, что NaN
значения изначально были проблемой.
Вот блок, который я запускаю:
my_tpot = TPOTRegressor()
X_train, X_test, y_train, y_test = train_test_split(pd.np.array(features), pd.np.array(labels),train_size=0.75, test_size=0.25)
tpot = TPOTRegressor(generations=5, population_size=20, verbosity=2)
tpot.fit(X_train, y_train)
Исключения происходят на train_test_split
линия.Вот исключение:
ValueError: Error: Input data is not in a valid format. Please confirm that the input data is scikit-learn compatible. For example, the features must be a 2-D array and target labels must be a 1-D array.
Что вызывает это?