Я новичок, пытающийся изучать науку о данных, работая в проектах, поэтому, пожалуйста, извините, если мой вопрос не сформулирован должным образом.
Я попытался проверить документацию с автоимпульсами для стохастического c вменения регрессии, но не смог Я не понимаю, что такое формат ввода, который должен быть задан, если это объект dataframe или ndarray, и какие предикторы или аргументы стратегии содержатся в следующем коде
from autoimpute.imputations import SingleImputer, MultipleImputer
si = SingleImputer() # imputation methods, passing through the data once
mi = MultipleImputer() # imputation methods, passing through the data multiple times
# simple example using default instance of MultipleImputer
imp = MultipleImputer()
# fit transform returns a generator by default, calculating each imputation method lazily
imp.fit_transform(data)
imp = MultipleImputer(
n=10,
strategy={"salary": "pmm", "gender": "bayesian binary logistic", "age": "norm"},
predictors={"salary": "all", "gender": ["salary", "education", "weight"]},
imp_kwgs={"pmm": {"fill_value": "random"}},
visit="left-to-right",
return_list=True)
Может кто-нибудь объяснить, что это за аргументы и Что такое данные, которые должны быть предоставлены или любые другие реализации для стохастии c Вменение регрессии
Заранее спасибо