Предположим, у меня есть набор данных MNIST (60000 строк и 784 столбцов), где каждая строка представляет изображение размером 28x28 (784) пикселей.
Должен ли я нормализоваться по признакам, то есть найти среднее и стандартное отклонениеодного столбца и нормализовать этот столбец или я должен найти среднее и стандартное отклонение одной строки и нормализовать строку?
Я реализовал код для прогнозирования в наборе данных MNIST, используя LDA с нуля, не используя scikit, т.е. нахождение ковариациикаждого класса. Но я не получал правильного прогноза. Поэтому я нормализовал строки, то есть улучшил интенсивность изображения, и это сработало, после чего я подумал о нормализации столбцов (без нормализации строк) и получил плохой прогноз. В двух словах, это сработало, когда я нормализовал строки вместо столбцов. Даже я в замешательстве.