Проверьте, как набор данных MNIST курируется здесь:
http://yann.lecun.com/exdb/mnist/index.html
Цитировать соответствующий раздел:
Исходные черно-белые (двухуровневые) изображения из NIST были нормализованы по размеру, чтобы поместиться в поле 20x20 пикселей при сохранении их соотношения сторон. Полученные изображения содержат уровни серого в результате использования метода сглаживания, используемого алгоритмом нормализации. изображения центрировались на изображении 28x28 путем вычисления центра масс пикселей и перемещения изображения таким образом, чтобы расположить эту точку в центре поля 28x28.
С некоторыми методами классификации (особенно на основе шаблонов,
таких как SVM и K-ближайших соседей), частота ошибок улучшается, когда
цифры центрированы ограничительной рамкой, а не центром масс. если ты
сделать такую предварительную обработку, вы должны сообщить об этом в своем
публикации.