Приведенные выше модели можно использовать для различных применений, таких как диагностика рака кожи по изображениям повреждений, рулевое управление в автономных транспортных средствах и классификация пород собак на веб-сайте, где пользователи загружают фотографии своих домашних животных.Например, учитывая несколько изображений пород собак в качестве данных обучения - когда пользователь загружает фотографию своей собаки - гипотетический веб-сайт должен возвращать прогноз с достаточно высокой достоверностью.Но что должно произойти, если пользователь загрузит фотографию кошки и попросит веб-сайт принять решение о породе собаки?
Вышеприведенный пример является примером данных теста на распространение.Модель была обучена на фотографиях собак разных пород, и (надеюсь) научилась хорошо различать их.Но модель никогда не видела кошку раньше, и фотография кошки лежала бы вне распределения данных, на котором обучалась модель.Этот иллюстративный пример может быть расширен до более серьезных настроек, таких как МРТ-сканирование со структурами, которые система диагностики никогда ранее не наблюдала, или сцены, на которых автономная система управления автомобилем никогда не обучалась.
Возможным желаемым поведением модели в таких случаях было бы возвращение прогноза (попытка экстраполировать вдали от наших наблюдаемых данных), но возвращение ответа с дополнительной информацией о том, что точка лежит за пределами данныхраспределение.Мы хотим, чтобы наша модель обладала некоторой величиной, передающей высокий уровень неопределенности с такими входными данными (альтернативно, передавая низкую достоверность).
Чтобы повысить точность обнаружения в автомобильной связи, вы должны иметь не только информацию об обнаружении, но и неопределенность.
Ваш вопрос довольно широкий, поэтому я не уверен, что мой ответ мог бы помочь, но пожалуйста.