Как получить средние прогнозы, рассчитанные по частичной зависимости в sklearn, в формат данных - PullRequest
0 голосов
/ 19 сентября 2019

Я пытался понять, как получить средние прогнозы для каждого значения переменной-предиктора, как указано в grid в sklearn.inspection.Я искал что-то вроде pred.grid для pdp R, который экспортирует среднюю вероятность вместе со связанным значением X, но не повезло.

Более того, некоторые значения в pdp оказываются отрицательными, что должноэто не так, потому что я ожидаю, что это будут средние вероятности.

pdp,axes = partial_dependence(clf_gb,X_train,[0],grid_resolution = 20)

pdp
Out[348]: 
array([[-0.39800376, -0.37628756, -0.37831865, -0.39123722, -0.19362127,
        -0.11376884, -0.08473623, -0.08473623, -0.08706586, -0.0810841 ,
        -0.08846314,  0.23854052,  0.32475344,  0.32475344,  0.22117284,
         0.222185  ,  0.27246533,  0.26838905,  0.24745986,  0.17361787]])

axes
Out[349]: 
[array([25.        , 27.10526316, 29.21052632, 31.31578947, 33.42105263,
        35.52631579, 37.63157895, 39.73684211, 41.84210526, 43.94736842,
        46.05263158, 48.15789474, 50.26315789, 52.36842105, 54.47368421,
        56.57894737, 58.68421053, 60.78947368, 62.89473684, 65.        ])]

Может ли кто-нибудь любезно направить меня в правильном направлении?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...