Я знаю, что на форуме есть похожая тема, но нет ответа на мой вопрос, и я пытался по-разному ( R regex - извлекать слова, начинающиеся с символа @ ). Мне нужно выписать все слова, перед которыми нет символа.
Ниже приведен код, который вырезает все слова, содержащие знак # и результат этого действия.
tweeter <- c("#tweeter tweet", "h#is", "tweet #tweeter2", "twet")
str_extract_all(tweeter, "(?<=\\B\\#)[^\\s]+")
Результат этого:
[[1]]
[1] "tweeter"
[[2]]
character(0)
[[3]]
[1] "tweeter2"
[[4]]
character(0)
Теперь код, с помощью которого он пытается отобразить все слова без # в начале.
regmatches(tweeter, gregexpr("\\B#\\S+", tweeter), invert = T)
Я хотел бы отобразить список слов, которые не начинаются с #, просто не знаю, как это правильно написать.