Влияет ли форма тензора для изображения на итоговый результат? - PullRequest
0 голосов
/ 21 марта 2019

Я представляю изображения размером 100 на 100 пикселей, поэтому я могу иметь форму (None, 100, 100, 3) или форму (None, 10000, 3)

Я не могу найти какое-либо четкое объяснение в Google, однако, будут ли следующие дватензорные результаты приводят к аналогичным результатам?

  1. (None, 100, 100, 3)
  2. (None, 10000, 3)

Я полагаю, что одного из них достаточно, поскольку я думал, что нейронная сеть будетвсе еще учитесь так же хорошо, если изображение находится в одном ряду, ваши мысли?

1 Ответ

0 голосов
/ 21 марта 2019

Для 1-й фигуры: ( 100 , 100 , 3 )

Это трехмерный тензор.Если вы работаете с плотными слоями, они требуют двухмерного ввода.Да, 1D сверточные слои существуют, но они зарезервированы для совершенно разных вариантов использования.

Сверточный слой будет проходить ядро ​​через определенные шаги и будет собирать пространственную информацию.Затем это ядро ​​будет объединено, так что информация будет сохранена, но с меньшими размерами.

Следовательно, изучение с этой формой будет намного лучше, поскольку изучение пространственных особенностей будет иметь место.Это отлично подходит для классификации изображений.

Для 2-й формы: ( 10000 , 3 )

Это 2-мерный тензор, который будет работать с 1D сверточными слоями и плотными слоями,

1D Свертки проходят ядро ​​только через одну прямую линию (ось).Также элементы изображения будут выровнены по прямой (все столбцы будут выстроены в линию).Это разрушит особенности изображения.

Следовательно, наконец, изображение является 2D-объектом a и должно быть сохранено в его исходном измерении, чтобы облегчить обучение.У 1D-тензора есть и другие применения, такие как классификация текста, распознавание человеческой деятельности и т. Д.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...