У меня есть столбик, и в этом столбце есть столбец с именем "описание". Здесь имеется около 380 000 описаний.
Пример описания:
"Сокращения очень полезны"
This это просто пример, чтобы познакомить вас с моими данными. Все описания разные.
У меня также есть тиббл с правильно написанными словами. Приблизительно 42 000 уникальных правильно написанных слов.
Моя задача состоит в том, чтобы заменить все слова с ошибками в описаниях правильно написанными словами. Таким образом, слово «hlpful» будет заменено на «полезный».
Мой код выглядит следующим образом:
countKeyWords <- 1
countDescriptions <- 1
amountKeyWords <- 42083
amountDescriptions <- 379571
while (countKeyWords < amountKeyWords){
while (countDescriptions < amountDescriptions){
semiFormatTet$description[countDescriptions] <-
gsub(keyWords$SearchFor[countKeyWords], keyWords$Map[countKeyWords], semiFormatTet$description[countDescriptions], ignore.case = TRUE)
countDescriptions = countDescriptions + 1
}
countDescriptions = 0
countKeyWords = countKeyWords + 1
}
Примечание :
SearchFor: Префикс правильно написанных слов для сравнения с словом с ошибкой в описании.
Карта: правильно написанное слово, которое заменит слово с ошибкой ,
Таким образом, l oop будет выполняться почти 16 000 000 000 раз. Это очень неэффективно, как бы я сделал этот l oop более эффективным, чтобы мне не пришлось ждать месяц до его окончания sh?