Я пытался понять, как получить средние прогнозы для каждого значения переменной-предиктора, как указано в grid в sklearn.inspection.Я искал что-то вроде pred.grid для pdp R, который экспортирует среднюю вероятность вместе со связанным значением X, но не повезло.
Более того, некоторые значения в pdp оказываются отрицательными, что должноэто не так, потому что я ожидаю, что это будут средние вероятности.
pdp,axes = partial_dependence(clf_gb,X_train,[0],grid_resolution = 20)
pdp
Out[348]:
array([[-0.39800376, -0.37628756, -0.37831865, -0.39123722, -0.19362127,
-0.11376884, -0.08473623, -0.08473623, -0.08706586, -0.0810841 ,
-0.08846314, 0.23854052, 0.32475344, 0.32475344, 0.22117284,
0.222185 , 0.27246533, 0.26838905, 0.24745986, 0.17361787]])
axes
Out[349]:
[array([25. , 27.10526316, 29.21052632, 31.31578947, 33.42105263,
35.52631579, 37.63157895, 39.73684211, 41.84210526, 43.94736842,
46.05263158, 48.15789474, 50.26315789, 52.36842105, 54.47368421,
56.57894737, 58.68421053, 60.78947368, 62.89473684, 65. ])]
Может ли кто-нибудь любезно направить меня в правильном направлении?