Каждый *Explainer
класс имеет метод shap_values
, который возвращает список массивов MxN numpy, где M = # objects
, N = # features
.
Важность переменной измеряется mean(|SHAP value|)
, как указано в README РЕПО . Поэтому, если ваши данные находятся в pandas фрейме данных, вот как получить список отсортированных по важности функций:
per_feature_mean_shap = np.abs(shap_values[0]).mean(axis=0)
df.columns[np.argsort(per_feature_mean_shap)]