Я должен участвовать в исследовательском проекте, касающемся применения глубокого обучения для классификации.У меня есть огромный набор данных, содержащий более 35000 объектов - это хорошие значения, взятые из лаборатории.
Идея состоит в том, что мне следует создать классификатор, который должен сообщать с учетом нового ввода, если данные кажутся хорошимиили нет.Я должен использовать глубокое обучение с керасом и тензорным потоком.
Проблема в том, что данные не классифицированы.Я введу новый столбец с 1 для хорошего и 0 для плохого.Проблема в том, как я могу узнать, является ли запись плохой, учитывая тот факт, что весь обучающий набор хорош?
Я думал о создании некоторых данных мусора, но я не знаю, если это хорошоидея - я даже не знаю, как ее генерировать.Есть ли у вас какие-либо советы?