groupby для pandas фрейма данных дает неправильные результаты - PullRequest
0 голосов
/ 16 июня 2020

Я пытаюсь воспроизвести статью, код которой был написан в Stata для моего курсового проекта с использованием Python. Мне трудно воспроизвести результаты команды свертывания в их do-файле. Соответствующая строка в do-файле -

collapse lexptot, by(clwpop right)

, а у меня

df.groupby(['cwpop', 'right'])['lexptot'].agg(['mean'])

Переменная lexptot - это логарифм переменной 'exptot', которую я вычислил ранее. using np.log(dfs['exptot]).

Кто-нибудь знает, что здесь не так? Средние, которые я вычисляю, обычно примерно на 1,5 выше, чем средние, вычисленные в Stata.

1 Ответ

1 голос
/ 16 июня 2020

После того, как вы добавите в вопрос более важные детали, возможно, я смогу ответить больше. Но вот что, я думаю, может вам помочь!

df.groupby(['cwpop', 'right']).mean()['lexptot']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...