Форма вашего X_train означает, что у вас есть 60 000 образцов формы (28, 28), то есть, в основном, 60 000 изображений размером 28 на 28 и черно-белые, потому что у вас нет третьего канала.
Для вашего y_train это означает, что у вас есть 60 000 этикеток, поэтому одна этикетка для каждого соответствующего изображения.
Если вы хотите напечатать изображение, чтобы увидеть, как оно выглядит, вы можете сделать это:
(здесь первое изображение)
plt.imshow(X_train[0, :, :], 'gray')
plt.title("image label: "+ str(y_train[0]), fontsize=14)
Вам это понятнее?