Мы знаем, что глубокая нейронная сеть имеет фиксированный размер входного слоя, и размер входного слоя большинства DNN меньше, чем текущий стандартный размер видео, например, я получаю предварительно обученную модель FasterRCNN, которая имеет 500x375
размер входного слоя.
Но HD-видео имеет 1920x1080
res, а 4K имеет 3840x2160
res, поэтому нам пришлось уменьшить масштаб видео до 500x375
res, но операции уменьшения уменьшают детализацию видео, поскольку некоторые объектыне может обнаружить.
Помимо уменьшения масштаба, каковы другие способы адаптации видео к входному слою DNN?