Предположим, что нейронная сеть (NN), где каждый пример поезда имеет множество особенностей, и одна из этих функций - это информация о поле (мужчина или женщина).
Поскольку это категориальные данные, я постоянно вижу такие вещи, как:
If male, gender = 0
If female, gender = 1
Когда NN подается входными объектами, результат (пол x любой_вес) всегда будет равен 0, если пол = мужской. И (пол x any_weight) будет равен значению веса, если пол = женский.
Мне кажется, что способность обратного распространения обновлять веса будет как-то ограничена, потому что независимо от того, как вы меняете вес, (пол х любой_вес) будет давать 0, если пол = мужской.
И с этой точки зрения звучит как лучшая идея сказать:
If male, gender = 1
If female, gender = 2
Таким образом, мы гарантируем, что результат (пол х any_weight) не будет 0.
Но я мог бы упустить что-то здесь, потому что я продолжаю видеть, что категоризация (в большинстве случаев), кажется, начинается с 0.
Может быть, кто-то, имеющий больше опыта здесь, сможет лучше уточнить это и объяснить, что я здесь неправильно понимаю?
Использование 0 и 1 - это то же самое, что использование 1 и 2? Или, если нет, к какому нам идти?