Как считать записи в столбце, разделенные запятыми - PullRequest
0 голосов
/ 19 января 2020

У меня есть столбец reasons со строками респондентов. Ответы в reasons разделяются запятой, поэтому в одной ячейке в столбце reasons будет указано причина1, причина2, причина3 . Я хочу посчитать записи, которые включают в себя reason1 (независимо от того, является ли это единственной причиной в списке или нет). До сих пор я делал это

hair1 = read_excel('hair1.xlsx')
reason1 = data.frame(subset(hair1, reasons=='reason1'))

Этот только возвращает респондентов, которые указали причину1, а не тех, кто, возможно, перечислил причину1 с другими причинами.

dput(head(hair1)) структура (список (причины = c («причина1, причина2, причина3», «причина1, причина2»)

1 Ответ

1 голос
/ 19 января 2020

Подмножество с одним знаком равенства вместо двух сработавших

reason1 = data.frame(subset(hair1, reasons="reason1"))

...