Я конвертирую SAS в python и наткнулся на этот код, где я не соответствую точному значению. SAS говорит, что нужно взять средневзвешенное значение для столбцов партнеров и столбцов pwgtp. Но попробовал в python значение не совпадает.
proc means data=hhhead1 nway noprint;
weight pwgtp;
var associates;
output out=propassociates (drop=_:) mean=; run;
Ответ 0,2871426408 от SAS
Я пытался использовать различные методы, чтобы получить среднее значение веса.
Данные состоят из 1,2 миллиона строк
Не могу поделиться данными извините
propassociates = hhhead1.groupby(by = ['PWGTP_y'])['associates'].mean().reset_index()
np.mean(propassociates['associates'])
Ответ 0.26806426594942845
hhhead1['weight_sum'] = hhhead1['associates'] * hhhead1['PWGTP_x']
propassociates = hhhead1['weight_sum'].sum() / hhhead1['PWGTP_x'].sum()
ответ 0.08837267780237641
propassociates = hhhead1.groupby(by = ['PWGTP_y'])['associates'].mean().reset_index()
np.mean(propassociates['associates'])
Ответ 0.26806426594942845
hhhead1['weight_sum'] = hhhead1['associates'] * hhhead1['PWGTP_x']
propassociates = hhhead1['weight_sum'].sum() / hhhead1['PWGTP_x'].sum()
ответ 0.08837267780237641
Ответ 0,2871426408 от SAS
Ответ 0.26806426594942845