среднее значение с весовым эквивалентом питона - PullRequest
0 голосов
/ 17 июня 2019

Я конвертирую SAS в python и наткнулся на этот код, где я не соответствую точному значению. SAS говорит, что нужно взять средневзвешенное значение для столбцов партнеров и столбцов pwgtp. Но попробовал в python значение не совпадает.

proc means data=hhhead1 nway noprint;
 weight pwgtp;
 var associates;
 output out=propassociates (drop=_:) mean=; run;

Ответ 0,2871426408 от SAS

Я пытался использовать различные методы, чтобы получить среднее значение веса. Данные состоят из 1,2 миллиона строк Не могу поделиться данными извините

propassociates = hhhead1.groupby(by = ['PWGTP_y'])['associates'].mean().reset_index()

np.mean(propassociates['associates'])

Ответ 0.26806426594942845

hhhead1['weight_sum'] = hhhead1['associates'] * hhhead1['PWGTP_x']
propassociates = hhhead1['weight_sum'].sum() / hhhead1['PWGTP_x'].sum()

ответ 0.08837267780237641

propassociates = hhhead1.groupby(by = ['PWGTP_y'])['associates'].mean().reset_index()

np.mean(propassociates['associates'])

Ответ 0.26806426594942845

hhhead1['weight_sum'] = hhhead1['associates'] * hhhead1['PWGTP_x']
propassociates = hhhead1['weight_sum'].sum() / hhhead1['PWGTP_x'].sum()

ответ 0.08837267780237641

Ответ 0,2871426408 от SAS

Ответ 0.26806426594942845

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...