Если вы используете метод .predict_classes вместо простого прогнозирования, вы получите вектор классов с наибольшей вероятностью.
Затем вы можете использовать confusion_matrix из sklearn.
test_predictions = model.predict_classes(x_test)
from sklearn.metrics import confusion_matrix
cm = confusion_matrix(y_true = y_test, y_pred = test_predictions)
print(cm)
форма test_predictions здесь (10000,).
Напечатанный результат будет примерно таким:
array([[ 967, 1, 1, 2, 0, 1, 5, 0, 2, 1],
[ 0, 1126, 3, 1, 0, 1, 1, 0, 3, 0],
[ 3, 2, 1001, 8, 1, 0, 3, 6, 8, 0],
[ 0, 0, 1, 1002, 0, 1, 0, 1, 5, 0],
[ 3, 1, 2, 2, 955, 2, 6, 1, 3, 7],
[ 3, 1, 0, 37, 1, 833, 9, 0, 6, 2],
[ 4, 3, 1, 1, 1, 3, 941, 0, 4, 0],
[ 2, 9, 8, 5, 0, 0, 0, 988, 8, 8],
[ 3, 1, 3, 10, 3, 2, 2, 3, 946, 1],
[ 3, 8, 0, 10, 8, 8, 1, 4, 5, 962]],
dtype=int64)