Есть ли способ получить уверенность (оценка или интервал) в прогнозе логистической модели VW? - PullRequest
0 голосов
/ 18 октября 2019

Я работаю над проблемой с большим и редким набором данных. Прогнозы логистической регрессии с использованием VW являются удовлетворительными. Теперь, чтобы улучшить производительность системы, мне нужно иметь возможность определить доверительный балл или доверительный интервал для прогнозирования вероятности. То есть, даже если две выборки данных имеют одно и то же предсказание, доверительная оценка или интервал должны быть в состоянии дифференцировать предсказания, которые исходят из хорошо изученных функций от прогнозов, происходящих из редких признаков. (Учтите, что переменные являются категориальными, поэтому в настройке VW каждая пара переменная-значение рассматривается как особенность.)

Итак, несколько вопросов:

  1. Поскольку это онлайн-обучение, есть ли способ рассчитать стандартные ошибки коэффициентов функций?

  2. Можем ли мы использовать ssgrad ( сумму в квадратеградиенты в адаптивных обновлениях ) из выходных данных VW в качестве эквивалентной альтернативы оценке неопределенности, предложенной в этой статье? Влияет ли какая-либо из реализаций, таких как инвариантные обновления и аппроксимации для ускорения обучения , на цель использования ssgrad в качестве показателя неопределенности?

Любые предложения, обсуждения и комментарии приветствуются.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...