При работе с изображениями в глубоком обучении мы почти следуем правилу «Нормализация значений пикселей путем деления их на 255» , неукоснительно.
Причина, по которой, как я понимаю, заключается в том, что «Расчет точечного произведения весов с этими большими числами (от 0 до 255) займет больше времени, а объем памяти, занятой для таких вычислений, очень высок, а масштабирование устанавливает значения в диапазоне от 0 до 1 и, следовательно, уменьшает объем памяти и приводит к более быстрой конвергенции ".
Например, если значение пикселя равно 230, ему будет выделено 8 бит или 1 байт , Но если мы разделим его на 255, то получится 0,9, что согласно этой ссылке занимает как минимум 32 бита или 4 байта.
Учитывая разрешение изображения как 28 * 28 (для простоты), тогда, как я понимаю, вместо 784 байт теперь ему выделено 784 * 4 = 3136 байт.
Это только мое понимание, и я могу ошибаться. Может кто-нибудь уточнить, как именно нормализация значений пикселей путем деления их на 255 приводит к меньшим вычислениям и меньшему объему памяти.
Большое вам спасибо.