Обоснование для блоков связано с компромиссом местоположения / частоты. Изображение разделяется на блоки перед сжатием в спектральной области ( DCT ), так что артефакты, вызванные сжатием, более локализованы. В стандартном JPEG блоки имеют постоянный размер на всем изображении. Для более новых форматов, таких как JPEG2000, блоки адаптируются к изображению с помощью вейвлетов. Я не знаком с деталями видеоформатов, но обоснование такое же.
Это то же самое явление для аудиокодирования (mp3): вместо того, чтобы вычислять спектр для всего аудиофайла, вы разбиваете файл на несколько частей из нескольких выборок (несколько сотен, как правило, для сигналов 44,1 кГц). Аналогичным образом, при повреждении сжатых данных (сеть, поврежденный файл) вы услышите шумы, связанные с отсутствием окон.