Более быстрый способ поместить данные в формат, требуемый API обнаружения объектов Google - PullRequest
0 голосов
/ 09 июня 2019

Я использую API обнаружения объектов tenorflow в Google Colab (GPU).Я размещаю свой набор данных в Google Drive.API ожидает, что файлы изображений будут находиться в папках train / test.Мои изображения находятся в одной папке, и я использую CSV-файл, чтобы определить, предназначен ли файл для поезда или теста.Проблема, с которой я сталкиваюсь, заключается в том, что когда я добавляю больше классов к своим данным, мне постоянно приходится разбивать свои данные на обучающие и тестируемые папки, что занимает некоторое время, прежде чем я могу провести эксперимент.Вот как я это делаю.Будем весьма благодарны за любое более быстрое альтернативное решение.

  for img in train_imgs:
    filepath = img["filepath"]
    filename = os.path.basename(filepath)
    !cp "{filepath}" "./images/train/"
...