Значения SHAP / предиката h2o дают экстремальные значения для распределения Бернулли - PullRequest
0 голосов
/ 04 июля 2019

Когда я получаю значения SHAP с помощью функции h2o.predict_contributions для распределения Бернулли, я получаю экстремальные значения (т. Е. Для некоторых наблюдений / особенностей значение SHAP превышает 1 000 000 / меньше 1 000 000).Поэтому, когда я суммирую все значения SHAP для наблюдения и применяю функцию связи (1 / (1 + exp (-сумма SHAP))), я получаю прогноз 0 или 1 вместо вероятности между 0/1.

Что может вызвать такие большие значения SHAP при использовании распределения Бернулли?

Глядя на этот пост на github из h2o, кажется, что дистрибутив Бернулли был протестирован для SHAP: https://github.com/h2oai/h2o-3/pull/3378/files.

Кроме того, я рассмотрел график частичной зависимости для функций, затронутыхбольшие значения SHAP, и они кажутся нормальными (то есть без утечек или экстремальных паттернов).

...