Я обнаружил что-то странное во время работы с keras.
Из набора данных я вручную разделил поезд и тестовый набор.С набором поездов я использовал
validation_split=0.1 and shuffle=True
. Я ожидаю, что точность проверки возрастает до определенной точки, а точность теста также возрастает до этой определенной точки.но похоже, что точность набора проверки повышается, но модель не дает ожидаемой производительности, как показано в журнале ниже
Epoch 96/100
2710/2710 [==============================] - 0s 128us/step - loss: 0.6681 - acc: 0.7801 - val_loss: 0.8066 - val_acc: 0.7152
Epoch 97/100
2710/2710 [==============================] - 0s 128us/step - loss: 0.6551 - acc: 0.7823 - val_loss: 0.8254 - val_acc: 0.7086
Epoch 98/100
2710/2710 [==============================] - 0s 129us/step - loss: 0.6422 - acc: 0.7952 - val_loss: 0.7726 - val_acc: 0.7152
Epoch 99/100
2710/2710 [==============================] - 0s 128us/step - loss: 0.5999 - acc: 0.8173 - val_loss: 0.8234 - val_acc: 0.6755
Epoch 100/100
2710/2710 [==============================] - 0s 129us/step - loss: 0.5882 - acc: 0.8277 - val_loss: 0.8162 - val_acc: 0.6722
##########
Accuracy: 0.5594
##########
Я подозреваю, что если опция shuffle = True вызывает эту проблему;что он будет давать новый набор проверки каждую эпоху.
Я прав или есть что-то, что мне не хватает в опциях?