Ключевое слово здесь: рукописный .
Когда мы пытаемся классифицировать изображения рукописных цифр (MNIST), арифметические значения фактическихцифры (и, как следствие, их порядок) не являются частью проблемы классификации;в нем класс (то есть цифра) «9» не «больше», чем класс «8» (он также не «меньше»), а расстояние между классом «9» и классом «8» одинаково с расстояниеммежду "9" и "3" (фактически, это одинаково для всех пар классов). Другими словами, цифры обрабатываются как категориальные переменные.
Другими словами, методология классификации здесь идентична той, которую мы использовали бы для классификации, скажем, рукописных букв , которые изКонечно, нет никакого упорядочения в арифметическом смысле (ни одна буква не «больше» или «меньше», чем любая другая).
Другая, возможно, полезная аналогия - между число 9
и символ '9'
;на самом деле, в классификации рукописных цифр мы имеем дело со вторым, а не с цифрами. И символы / строки, такие как буквы, не поставляются с каким-либо арифметическим порядком.
Случай такой же, например, с набором данных iris, или в задачах, где мы пытаемся предсказать пол (мужской / женский)).
Существуют проблемы классификации , в которых метка, хотя и категориальная, также порядковая (т.е. они упорядочены), например что-то вроде high / medium / low;но классификация цифр MNIST не подпадает под эту категорию - все дело в распознавании образов и различении цифровых изображений без использования их фактических значений или упорядочения.