Мне кажется, я понимаю разницу между NHWC и HCHW.
NHWC (партия, высота, ширина, каналы) имеет порядок выходного индекса, предполагая, что 3 входных канала представляют RGB, R0, G0, B0, R1, G1, B1, ..., Rc, Gc, Bc,
NCHW (партия, каналы, высота, ширина) имеет порядок выходного индекса, предполагая, что 3 входных канала представляют RGB, R0, R1, ..., Rc, G0, G1, ..., Gc, B0, B1, ..., Bc.
(это единственная разница?)
Меня интересует, почему NCHW лучше / быстрее, когда речь идет о производительности графического процессора.