Я пытаюсь воспроизвести статью, код которой был написан в Stata для моего курсового проекта с использованием Python. Мне трудно воспроизвести результаты команды свертывания в их do-файле. Соответствующая строка в do-файле -
collapse lexptot, by(clwpop right)
, а у меня
df.groupby(['cwpop', 'right'])['lexptot'].agg(['mean'])
Переменная lexptot
- это логарифм переменной 'exptot
', которую я вычислил ранее. using np.log(dfs['exptot])
.
Кто-нибудь знает, что здесь не так? Средние, которые я вычисляю, обычно примерно на 1,5 выше, чем средние, вычисленные в Stata.