У меня 1000 изображений собак и 1000 изображений кошек.
Я обучил небольшую CNN проводить классификацию по этому набору данных, и точность обоих наборов проверки / проверки составляет 99% +.
Но я заметил, что когда я даю информацию, которая не является кошкой или собакой, например, машиной, классификатор (иногда) дает высокую степень доверия к кошке или собаке.
Почему это? Я понимаю, что Си-Эн-Эн была обучена только на двух классах, но если она видит что-то совершенно случайное, разве она не должна показывать низкую достоверность для обоих классов?
Я предполагаю, что эта проблема решается с помощью отрицательных примеров (других случайных объектов и животных), но тогда возникает вопрос: сколько отрицательных примеров необходимо, чтобы по-настоящему охватить распределение всех возможных случайных изображений (которые не являются кошек или собак)?