Модель машинного обучения неправильное прогнозирование - PullRequest
3 голосов
/ 12 октября 2019

У меня есть классификатор машинного обучения от создания ML. Модель обучена с 3400 образцов, и в целом впечатляет, насколько она точна. Однако модель очень часто делает неправильные прогнозы, и я не могу понять, как добавить это в модель, чтобы у нее не было такой высокой достоверности в отношении некоторых из этих неправильных прогнозов. Как / я могу перенастроить модель с этим новым фрагментом данных, который ошибочен в своей классификации, что он не относится к этой классификации? Должен ли я создать новую папку классификации и добавить к ней эти неправильные классификации, или есть способ научить модель передавать ее как неклассифицируемый тип, чтобы она могла попытаться понять разницу между ними?

1 Ответ

3 голосов
/ 07 ноября 2019

Отказ от ответственности: До сих пор я не работал с createML. Как я понимаю из вопроса, вы предоставляете свои данные обучения через структуру папок, а затем обучение и оценка выполняются нажатием кнопки. Поправьте меня, если я сделал неверное предположение.

Было бы неплохо узнать, какую модель / архитектуру вы используете и как выглядят ваши тренировочные образцы.

Для меня ваша проблема звучит так, как будто эти плохо предсказанные образцы могут быть недостаточно представлены в вашем общем наборе данных. Есть несколько приемов, которые вы можете попробовать здесь:

  1. Просто продублируйте (скопируйте и вставьте в папку с вашими учебными образцами) эти образцы для вашего тренировочного процесса, чтобы удвоить ошибкуобратная связь по этим конкретным выборкам.
  2. Более сложный подход заключается в применении к этим выборкам стратегий дополнения данных и последующем добавлении расширенных выборок к вашему набору обучающих данных.

В зависимости от типа вашего примера, существуют доступные пакеты расширения для Python, и они довольно просты и просты в использовании.

...