Оператор веса применяет вес ко всей строке. На обоих независимых и зависимых
Например, если у вас есть только эти четыре строки в наборе данных,
Resolution_status dependent_var weight X1 X2 X3 X4 X5
Resolved 1 1 30 1500 3 3
Resolved 0 1 15 750 1 1
Unresolved 1 0.6 5 500 6 6
Unresolved 0 0.4 5 500 6 6
Способ посмотреть на это так: хотя на самом деле у вас есть 4 строки, для всех вычислительных целей предполагается, что этот набор данных имеет только 3 (Sigma (вес) = 1 + 1 + 0,6 + 0,4 = 3) строки.
Таким образом, когда вы запускаете логистическую процедуру с переменной веса в качестве 'веса' в вышеуказанном наборе данных 4 наблюдений, вы технически моделируете логистическую регрессию для:
3 наблюдения, при этом число наблюдений с зависимостью (var = 1) составляет 1,6; и число наблюдений с зависимостью_var = 0 составляет 1,4;
Весовые коэффициенты также подразумеваются для независимых переменных (X1 - X5). Например, если вы хотите вычислить среднее значение X1, оно больше не является (30 + 15 + 5 + 5) / 4; вместо этого оно составляет (30 * 1 + 15 * 1 + 5 * 0,6 + 5 * 0,4) / 3
Это вес с технической точки зрения. Однако, комментируя вашу предпосылку и вопрос об эффективности такого подхода, я бы воздержался от комментариев здесь, так как это зависит от дальнейшего понимания вашего случая и вашего уровня комфорта с предположениями, сделанными с точки зрения кредитного риска ...
надеюсь, это поможет ...