У меня есть столбец reasons
со строками респондентов. Ответы в reasons
разделяются запятой, поэтому в одной ячейке в столбце reasons
будет указано причина1, причина2, причина3 . Я хочу посчитать записи, которые включают в себя reason1 (независимо от того, является ли это единственной причиной в списке или нет). До сих пор я делал это
hair1 = read_excel('hair1.xlsx')
reason1 = data.frame(subset(hair1, reasons=='reason1'))
Этот только возвращает респондентов, которые указали причину1, а не тех, кто, возможно, перечислил причину1 с другими причинами.
dput(head(hair1))
структура (список (причины = c («причина1, причина2, причина3», «причина1, причина2»)