Визуальное описание формы тензоров - PullRequest
0 голосов
/ 06 мая 2020

В своей книге «Глубокое обучение для Python» Франсуа Шоле описывает тензоры следующим образом:

Tensors

Первый из них - 3D-тензор. с (образцы, отметки времени, особенности). Если у меня есть 20 аудиозаписей длиной 1024 каждая, у меня будет тензор формы

(20,1024,1)

Второй - 4D-тензор (образцы, высота, ширина, глубина). Например, 20 изображений с 10 x 10 пикселей и 3 цветными каналами будут иметь форму:

(20,10,10,3)

Но я не понимаю, почему последняя ось тензора для первого примера, равная 1, описывается как «Особенности», а не как «каналы»; или это то же самое? Если я хочу использовать, например, две аудиозаписи всегда вместе-> (10,1024,2), будет ли изображение включать второй канал вместо увеличения высоты с помощью «Features»? Я сбит с толку и не понимаю разницы между функциями и каналами.

...