Типичная модель обнаружения объектов с возможностью делать около 1000 прогнозов для каждого изображения (хотя это может быть намного больше в зависимости от архитектуры модели). Большинство этих прогнозов имеют очень низкую достоверность, поэтому они отфильтровываются. Затем те, которые остались, отправляются через не максимальное подавление (NMS), которое удаляет ограничивающие прямоугольники, которые слишком сильно перекрываются.
В вашем случае кажется, что порог для NMS слишком низкий (или слишком высокая), потому что многие перекрывающиеся блоки выживают.