У меня есть следующие данные CSV myData
:
name attribute
1 Name1 attr11,attr12,attr13
2 Name2 attr21
3 Name3 attr31,attr32
Я хочу построить график распределения количества атрибутов, для этого мне нужно перебрать каждую строку и токенизировать данные встолбец attribute
и посчитайте длину. По сути, это должно дать вектор или другие данные той же длины, что и исходные myData
Я пробовал:
num_attr <- length(as.list(strsplit(myData$attribute, ","))) #this just returns 3
и:
num_attr <- as.list(strsplit(myData$attribute, ","))
это возвращает список что-то вроде:
["attr11" "attr12" "attr13", "attr21", "attr31" "attr32"]
Я также думаю об использовании apply()
, как apply(myData, 1, func)
, но я не уверен, что func
вставить.
InРезюме, как я могу построить распределение / плотность количества атрибутов?