Я собираюсь создать детектор объектов, чтобы выполнять обнаружение таких объектов, как обнаружение транспортных средств и зданий, используя снимки сверху, такие как xView .Скажем, у меня есть два набора данных: 1) данные с обильными обилиями ограничивающих рамок в изображениях всей сцены и 2) намного меньший набор данных с очень небольшим количеством меток для редких классов, которые я сгенерировал или синтезировал (например, синтетические данные из САПР)модели) без ограничивающих надписей (только метки уровня изображения) без какого-либо фонового контекста или сцены.
Как я могу интегрировать изображения из набора данных 2 в обучение глубокой сети, такой как RCNN или YOLO, чтобы увеличить количество меток набора данных 1, чтобы найти эти редкие классы?