Как исправить ошибку форм массива Numpy и TPOT? - PullRequest
0 голосов
/ 23 марта 2019

Я пытаюсь передать массив feature и label numpy в train_test_split.Объекты представляют собой один столбец (дата-время dtype преобразуется в целое число).В массиве labels имеется 900 наблюдений.

features.shape возвращает (1101, 1)

labels.shape возвращает (1101, 900)

Перед разбиением на массивы объектов и метокЯ сделал df.fillna(0, inplace=True), потому что я думал, что NaN значения изначально были проблемой.

Вот блок, который я запускаю:

my_tpot = TPOTRegressor()
X_train, X_test, y_train, y_test = train_test_split(pd.np.array(features), pd.np.array(labels),train_size=0.75, test_size=0.25)
tpot = TPOTRegressor(generations=5, population_size=20, verbosity=2)
tpot.fit(X_train, y_train)

Исключения происходят на train_test_splitлиния.Вот исключение:

ValueError: Error: Input data is not in a valid format. Please confirm that the input data is scikit-learn compatible. For example, the features must be a 2-D array and target labels must be a 1-D array.

Что вызывает это?

1 Ответ

0 голосов
/ 23 марта 2019

Оказывается, что в настоящее время TPOT не может решить проблемы регрессии с несколькими метками, поэтому моя проблема с передачей размера метки (101, 900) не сработает.Если это сводится к одному столбцу, код работает нормально.

...