В настоящее время я использую SGDClassifier
, предоставленный библиотекой scikit-learn
.Когда я использую метод fit
, я могу установить параметр sample_weight
:
Веса, применяемые к отдельным выборкам.Если не указано иное, предполагаются одинаковые веса.Эти веса будут умножены на class_weight (переданный через конструктор), если указан class_weight
Я хочу переключиться на PySpark и использовать класс LogisticRegression
.В любом случае я не могу найти параметр, похожий на sample_weight
.Есть параметр weightCol
, но я думаю, что он делает что-то другое.
Есть ли у вас какие-либо предложения?