Мы можем использовать следующий шаблон:
sample <- subset(df, grepl('s.*p.*z.*o', col_1))
Это выберет строки, когда в строке будет spzoo
, независимо от того, что находится между ними.
Мы можем проверить регулярное выражение на векторе.
x <- c('first sp.z.o.o.', 'second s.a', 'third sp z o o', 'fourth PP',
'fifth sp z o.o.', 'sixth', 'seventh sp z oo', 'eighth LTD.',
'nineth sp-z-o-o', 'tenth spzoo', 'eleventh sp.zo.o')
grep('s.*p.*z.*o', x, value = TRUE)
#[1] "first sp.z.o.o." "third sp z o o" "fifth sp z o.o." "seventh sp z oo"
#[5] "nineth sp-z-o-o" "tenth spzoo" "eleventh sp.zo.o"
РЕДАКТИРОВАТЬ
Для обновленного набора данных мы можем использовать
sample <- subset(df, grepl('sp.?z.?o.?o', col_1))