YOLO, вероятно, сможет решить проблему шума, но все же это не лучший набор данных, который вы можете сделать.Для большей точности я предлагаю вам использовать модель YoloV3-SPP (Spatial Pyramid Pooling).Вы можете использовать модель SPP из этого популярного репо https://github.com/AlexeyAB/darknet.
В darknet/cfg/yolov3-spp.cfg
вы можете видеть, что есть добавление блока SPP:
### SPP ###
[maxpool]
stride=1
size=5
[route]
layers=-2
[maxpool]
stride=1
size=9
[route]
layers=-4
[maxpool]
stride=1
size=13
[route]
layers=-1,-3,-5,-6
### End SPP ###
SPP использует понижающую дискретизацию (шаг = 2)в сверточных слоях + используйте 3 разных пула максимального размера для одного и того же изображения и получите лучшие функции в слоях Max-Pooling.Я думаю, что добавление слоя Max pooling уменьшит некоторые шумы на изображении, выбрав только максимальные значения и важные функции из изображения.