Я пытаюсь в R найти испанские слова в нескольких словах. У меня есть все испанские слова из Excel, которые я не знаю, как прикрепить к сообщению (в нем более 80000 слов), и я пытаюсь проверить, есть ли на нем какие-то слова.
Например:
words = c("Silla", "Sillas", "Perro", "asdfg")
Я пытался использовать это решение :
grepl(paste(spanish_words, collapse = "|"), words)
Но есть слишком много испанских слов, и дает мне эту ошибку:
Error
Итак ... кто я могу это сделать? Я также попробовал это:
toupper(words) %in% toupper(spanish_words)
Результат
Как вы можете видеть, эта опция дает только TRUE в точных совпадениях, и мне нужно, чтобы "Sillas" также отображались как TRUE (это слово во множественном числе silla). По этой причине я сначала попробовал grepl, чтобы получить множественное число.
Есть идеи?