Как я могу обучить одну модель, где у меня есть два разных набора данных для одновременного обучения? - PullRequest
1 голос
/ 29 апреля 2019

В настоящее время я работаю над моделью, в которой мне нужно предсказать некоторые материалы, такие как лестницы, гайки, болты, мышь, бутылки и т. Д. Я написал один алгоритм для этого, который работает нормально на данный момент, набор изображений, которыеУ меня есть доступ к моему локальному компьютеру, и у меня достаточно данных для обучения, а также для обучения и тестирования.На данный момент у меня есть 26 классов изображений, все из которых являются типом материала.

Теперь это нормально, но я хочу, чтобы изображение не принадлежало указанным классам изображений.Я хочу, чтобы он возвращал что-то вроде этого, где указывалось бы, что это не материал, а совсем другая картина.

Чтобы сделать это, я имею в виду двойную тренировку моей модели с другим набором изображений (например, Imagenet), где, просто смотря на любое нематериальное изображение, я получаю что-то вроде этого "это не материал! "

Таким образом, одна и та же модель будет обучаться на двух разных наборах данных, один набор данных - это мой набор данных материала, другой - что-то кроме материалов, например, изображений в Imagenet.

Мой вопроскак мне подойти к этому?Или мне вообще нужно это сделать?Или же я просто пишу простой if - else и помещаю все, что он не признает материальным, как нематериальный тип?

1 Ответ

3 голосов
/ 29 апреля 2019

Вы можете просто объединить два набора данных и пометить те, которые не принадлежат к указанным 26 классам, как специальный 27-й класс.Когда ваша модель предсказывает этот класс, вы знаете, что он не является частью вашего набора данных.Например:

pred = [0.1, 0.1, 0.8] # Assume label 2 is not-this-dataset label

, затем вы можете использовать изображения из другого набора данных с меткой 2 и тренироваться как обычно в тренировочном цикле.Удостоверьтесь в сбалансированности набора данных, так как в нем не слишком много специальных меток не-этого-набора данных, чтобы ваша модель не соответствовала и просто предсказывала, что все не из вашего исходного набора данных.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...