Графики частичной зависимости с минимальным / максимальным (интервалом) и не только средним в Python - PullRequest
0 голосов
/ 26 сентября 2018

Добрый день,

Я применил алгоритм lightGBM для набора данных о ценах на недвижимость (85524 наблюдения и 167 функций).Я хочу получить взаимодействие между годом и размером площади недвижимости к цене.Зависимая переменная преобразуется с помощью log1p для получения нормального распределения.

Я использовал Python, модуль pdpbox, для генерации графика взаимодействия.Как я понимаю, окраска - это средняя цена между переменными, однако я бы хотел получить интервал взаимодействия, то есть min и max.Возможно ли это сделать?

LGBMR.fit(df_train.drop(["Price"], axis = 1, inplace = False), df_train["Price"])

feats = ['Year', 'Real estate area']
p = pdp.pdp_interact(LGBMR, df, model_features = columns, features = feats)
pdp.pdp_interact_plot(p, feats, plot_type = 'grid')

enter image description here

Я добавляю график взаимодействия pdp.Например, в 2008 году объект недвижимости размером 0,52 был куплен по средней цене 5,697 (прогноз), но я хотел бы знать минимальную и максимальную прогнозируемую цену этого взаимодействия.

...