Разница в оптимизаторах. tf.keras.optimizers.Adadelta
использует скорость обучения 0,001. keras.optimizers.Adadelta
использует скорость обучения 1,0.
Проверьте keras.optimizers и tf.keras.optimizers.Adadelta для получения более подробной информации. В частности, на странице Tensorflow упоминается, что Adadelta должна иметь скорость обучения 1,0, чтобы соответствовать оригинальному документу.