Описание проблемы: В настоящее время я извлекаю имена из серии книг.Многие персонажи будут идти под никами, частями имен или названиями.У меня есть список имен, которые я использую в качестве шаблона для всех данных.Проблема в том, что я получаю несколько совпадений для полных имен и частей имен.Есть в общей сложности 3000 имен и вариаций имен, по которым я бегу много текста.В настоящее время имена извлекаются в порядке от самых длинных строк к самым коротким.
Вопрос:
Как я могу убедиться, что после извлечения шаблона любой текст, который ему соответствует, удаляется из строки?
Что я получу:
str_extract("Mr Bean and friends", pattern = fixed(c("Mr Bean", "Bean", "Mr")))
[1] "Mr Bean" "Bean" "Mr"
Что я хочу: (я знаю, что не могу добиться этого только с помощью str_extract ()или одна строка кода)
str_extract("Mr Bean and friends", pattern = fixed (c("Mr Bean", "Bean", "Mr")))
[1] "Mr Bean" NA NA