У меня есть data.table с именем client
, который имеет следующие столбцы:
"location" "clientID" "gender" "age" "startYear" "ag1" "ag2"
Существует переменная age
и две ее факторизованные версии: ag1
и ag2
.
Теперь я хочу сгруппировать свои данные, используя факторизацию ag1
:
agegroup <- sym(agegroup)
clientTotal <- client[,.(NOinsureds=length(clientID)), by = .(gender, agegroup, startYear)]
, что приводит к ошибке:
Show in New WindowClear OutputExpand/Collapse Output Error in
[ .data.table (clientData, , .(NOinsureds = length(clientID)), :
column or expression 2 of 'by' or 'keyby' is type symbol. Do not quote
column names. Usage: DT[,sum(colC),by=list(colA,month(colB))]
Я предполагаю, что это потому, что NSE
. Я немного читал об этом в Интернете, поэтому я включил agegroup <- sym(agegroup)
, но, похоже, он не работает.
Есть предложения?
Я буду много манипулировать данными, а также буду писать функции, так что, возможно, имейте это в виду при рекомендации решений:)