У меня есть база данных из более чем 80 000 наблюдений и 12 переменных. Каждое наблюдение может выбрать одну или несколько из 12 переменных; I w sh для подсчета количества частот каждой возможной комбинации. Я думаю, что использование ddply будет работать, но я не уверен, что указывать в качестве переменной (2-й аргумент), чтобы указать комбинацию, которую я хочу найти.
ddply(df, c(do I put all the 12 variables here?), summarize, freq=length(what do I put here?))
Любое руководство поможет. Вот база данных.
Спасибо! Andrea