Преобразование CNN из классификации в лог-регрессию? - PullRequest
0 голосов
/ 05 июля 2018

Я собрал CNN, используя tflearn, который классифицирует изображения с точки зрения их масштабирования от некоторого исходного разрешения (т. Е. 50%, 70% и т. Д.), Просто чтобы посмотреть, какую точность я могу получить для этой проблемы. Я новичок в машинном обучении, поэтому я подумал, что было бы неплохо начать с общей цели, чтобы сеть определяла масштабирование на любом уровне, а не только те немногие, которые я генерировал для классификации.

После получения разумного уровня точности я решил перейти на модель, чтобы выполнить логистическую регрессию вместо классификации, но у меня возникли некоторые проблемы как в теории, так и в применении. Во-первых, как должны выглядеть этикетки? Раньше я использовал один горячий массив для 5 разных классов, но, очевидно, это больше не применимо. Должны ли метки быть масштабным коэффициентом (т. Е. 0,5 для 50% и т. Д.) Или чем-то еще? Тогда должна ли сама модель выглядеть по-другому? Насколько я понимаю, на самом деле мне нужно только подправить функцию стоимости и бэкпроп / оптимизацию, а также изменить результат на одно значение вместо пяти. Опять же, я новичок, поэтому буду признателен за любые советы по этому вопросу.

Спасибо!

(Кроме того, я не включил сюда ни одного кода, потому что я чувствую, что эти вопросы довольно общие, и мой код на самом деле не настолько особенный или сложный, но если кому-то нужно его увидеть, чтобы помочь с ответом / предоставлением совета , просто спросите, и я опубликую некоторые из них здесь.)

1 Ответ

0 голосов
/ 05 июля 2018

Обычно в задачах классификации ваш вывод будет использовать функцию softmax для генерации "вероятностей". В нейронных сетях, чтобы преобразовать это в регрессионный подход, удалите слой softmax и измените выходное измерение с числа классов, которые у вас были ранее (5), до 1. Обучение этому должно дать вектор формы [batchsize x 1], который может быть введенным в функцию потерь с метками одинаковой формы, содержащими действительный масштабный коэффициент, предполагая, что это именно то, что модель пытается предсказать.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...