С данными.таблицы:
# example data
N <- 25
df <- data.frame(
age = sample(18:65, N, TRUE),
sex = sample(1:2, N, TRUE),
employment = sample(1:10, N, TRUE),
wages = sample(1:50, N, TRUE)*10
)
# convert to data.table
library(data.table)
setDT(df)
# pivot
df[employment != "", .(avg_wages = mean(wages)), by=.(age, sex)]
Для объяснения части 'pivot' на английском языке:
- Держите строки, где «занятость» не пуста
- Создайте новую переменную с именем «avg_wages», которая является средним значением «wages»
- Но где мы берем среднее значение заработной платы по «возрасту» и «полу»