Кто-нибудь знает, какая эталонная группа по умолчанию находится в полиномиальной логистической регрессии Pyspark.Например, у нас есть мультиклассовые результаты / цель A, B, C, and D
.
Как свеча выбирает справочную категорию?В стандартной логистической регрессии в другом программном обеспечении (например, R
, SAS
) вы можете установить контрольную группу самостоятельно.Таким образом, если ваша ссылка A
, вы получаете n-1
модели, объединенные вместе, и целевые классы смоделированы как A vs B, A vs C, and A vs D
.
. Вы хотите контролировать этот процесс, потому что если результат с небольшим числом значений(небольшая выборка наблюдений) устанавливается в качестве эталона, оценки будут нестабильными.
Вот ссылка на полиномиальную модель логистической регрессии в pyspark.Здесь итоговые классы равны 0, 1, 2, но нет ясности в отношении ссылки.Я предполагаю, что это может быть ноль, но не уверен в этом.