Я заметил, что этот вопрос довольно старый, но, надеюсь, это кому-нибудь поможет. С помощью sklearn вы можете использовать класс SGDClassifier для создания модели логистической регрессии, просто передав «log» как потерю:
sklearn.linear_model.SGDClassifier(loss='log', ...).
Этот класс реализует взвешенные выборки в функции fit()
:
classifier.fit(X, Y, sample_weight=weights)
где weights - массив, содержащий веса выборки, которые (очевидно) должны быть такой же длины, что и число точек данных в X.
См. http://scikit -learn.org / dev / modules / Генерированный / sklearn.linear_model.SGDClassifier.html для полной документации.