влияние распространения меток в глубоком обучении для решения проблемы регрессии - PullRequest
0 голосов
/ 29 января 2020

Я пытаюсь обучить модель CNN для проблемы регрессии, после этого я делю предсказанные метки на 4 класса и проверяю некоторые метрики точности. В матрице путаницы точность класса 2,3 составляет около 54%, а точность класса 1,4 - более 90%. метки находятся в диапазоне 0-100, а классы 1: 0-45,2: 45-60, 3: 60-70, 4: 70-100. Я не знаю, откуда возникла проблема Является ли это из-за распределения меток в обучающем наборе и каково решение! С уважением ... Я приложил сюжет по следующей ссылке.

Целевой набор учебных наборов

1 Ответ

0 голосов
/ 30 января 2020

Не стоит создавать классы таким образом. Предоставляя некоторым классам меньшее окно значений (т. Е. Вы прогнозируете 2 для 15 значений и 1 для 45 значений), вашей модели по сути сложнее предсказать класс 2, и лучшее, что будет изучено моделью во время обучения, будет по возможности избегайте класса 2.

Вы можете подтвердить это, посмотрев на Ложные негативы для классов 2 и 3, если их слишком много, это может быть связано с этим. Лучшее, что можно сделать, - это распределить выходное пространство по категориям на равные части, и доверяя вашей модели, вы узнаете, какие классы встречаются реже, не пытаясь самостоятельно установить эту пропорцию.

Если у вас нет хороших результатов, это означает, что вам нужно улучшить свою модель другими способами, возможно, может помочь увеличение данных для равномерного распределения обучающих образцов.

Если это не кажется убедительным для вас, попробуйте взглянуть на эту статью: https://papers.nips.cc/paper/95-alvinn-an-autonomous-land-vehicle-in-a-neural-network.pdf

В сквозных моделях для автономного вождения нейронные сети должны предсказать классы, указывающие угол поворота руля. Распределение этих значений сильно разбалансировано, так как большую часть времени машина едет прямо. Несмотря на это, лучшие модели не различают некоторые классы для адаптации к распределению данных.

Удачи!

...