Почему нет четкого порядка в классификации рукописных цифр? - PullRequest
0 голосов
/ 10 ноября 2019

Из главы 2 Элементы статистического обучения :

from chapter 2

Очевидно, 0, 1, 2, 3 .. ., 9 можно заказать. Что я недопонимаю? Это потому, что упорядочение этих цифр не помогает в классификации?

1 Ответ

1 голос
/ 10 ноября 2019

Ключевое слово здесь: рукописный .

Когда мы пытаемся классифицировать изображения рукописных цифр (MNIST), арифметические значения фактическихцифры (и, как следствие, их порядок) не являются частью проблемы классификации;в нем класс (то есть цифра) «9» не «больше», чем класс «8» (он также не «меньше»), а расстояние между классом «9» и классом «8» одинаково с расстояниеммежду "9" и "3" (фактически, это одинаково для всех пар классов). Другими словами, цифры обрабатываются как категориальные переменные.

Другими словами, методология классификации здесь идентична той, которую мы использовали бы для классификации, скажем, рукописных букв , которые изКонечно, нет никакого упорядочения в арифметическом смысле (ни одна буква не «больше» или «меньше», чем любая другая).

Другая, возможно, полезная аналогия - между число 9 и символ '9';на самом деле, в классификации рукописных цифр мы имеем дело со вторым, а не с цифрами. И символы / строки, такие как буквы, не поставляются с каким-либо арифметическим порядком.

Случай такой же, например, с набором данных iris, или в задачах, где мы пытаемся предсказать пол (мужской / женский)).

Существуют проблемы классификации , в которых метка, хотя и категориальная, также порядковая (т.е. они упорядочены), например что-то вроде high / medium / low;но классификация цифр MNIST не подпадает под эту категорию - все дело в распознавании образов и различении цифровых изображений без использования их фактических значений или упорядочения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...