ValueError: Ошибка при проверке цели: ожидается, что плотность_3 будет иметь форму (1,), но получен массив с формой (6,) - PullRequest
0 голосов
/ 10 декабря 2018

Я пытаюсь запустить мультиклассовую классификацию, используя следующую модель ANN:

classifier = Sequential()
classifier.add(Dense(units = 9, kernel_initializer = 'uniform', activation = 'relu', input_dim = 18))
classifier.add(Dense(units = 9, kernel_initializer = 'uniform', activation = 'relu'))
classifier.add(Dense(units = 9, kernel_initializer = 'uniform', activation = 'relu'))
classifier.add(Dense(units = 6 ,kernel_initializer = 'uniform', activation = 'softmax'))
classifier.compile(optimizer = 'adam', loss = 'sparse_categorical_crossentropy', metrics = ['accuracy'])
classifier.fit(X_train, y_train, batch_size = 10, epochs = 100) 
y_pred = classifier.predict(X_test) 

, где формат X_train:

[[31 8 27 ... 2 7 5]
 [31 8 11 ... 1 9 3]
 [6 0 4 ... 1 9 3]
 ...
 [55 55 134 ... 5 5 6]
 [41 9 111 ... 1 3 0]
 [19 9 28 ... 3 0 0]]

, а y_train:

[[0. 0. 0. 1. 0. 0.]
 [0. 0. 0. 0. 1. 0.]
 [0. 0. 0. 0. 1. 0.]
 ...
 [0. 0. 0. 0. 0. 1.]
 [0. 0. 0. 0. 0. 1.]
 [0. 0. 0. 0. 0. 1.]]

Форма X_train равна (352, 18), а форма y_train равна (352, 6), а форма X_test равна (152, 18).

При запуске выдает следующую ошибку:

Traceback (most recent call last):
  File "H:\p36564\Project ZS\tst1.py", line 110, in <module>
    classifier.fit(X_train, y_train, batch_size = 10, epochs = 100)
  File "H:\p36564\lib\site-packages\keras\engine\training.py", line 950, in fit 
    batch_size=batch_size)
  File "H:\p36564\lib\site-packages\keras\engine\training.py", line 787, in _standardize_user_data
    exception_prefix='target')
  File "H:\p36564\lib\site-packages\keras\engine\training_utils.py", line 137, in standardize_input_data
    str(data_shape))
ValueError: Error when checking target: expected dense_3 to have shape (1,) but got array with shape (6,)

Какие могут быть возможные причины этой ошибки?Любая помощь будет оценена.

1 Ответ

0 голосов
/ 10 декабря 2018

С формой y_train в том виде, в каком вы ее предоставили, используйте categorical_crossentropy в качестве функции потерь вместо sparse_categorical_crossentropy.Ваш y_train закодирован в горячем виде, а не в редких.Разреженная кодировка в вашем случае будет массивом, который выглядит следующим образом:

[3, 4, 4, ..., 5, 5, 5]

Чтобы попробовать это сами, преобразуйте y_train в разреженную кодировку следующим образом:

y_train_ = np.argmax(y_train, axis=1)

Это будет работать с sparse_categorical_crossentropy как функция потерь (без необходимости изменения архитектуры модели!)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...