В настоящее время я работаю с большим фреймом данных, содержащим много текста в каждой строке, и хотел бы эффективно идентифицировать и заменить слова с ошибками в каждом предложении пакетом hunspell
. Я смог определить слова с ошибками, но не могу понять, как сделать hunspell_suggest
в списке.
Вот пример фрейма данных:
df1 <- data.frame("Index" = 1:7, "Text" = c("A complec sentence joins an independet",
"Mary and Samantha arived at the bus staton before noon",
"I did not see thm at the station in the mrning",
"The participnts read 60 sentences in radom order",
"how to fix mispelled words in R languge",
"today is Tuesday",
"bing sports quiz"))
Я преобразовал текстовый столбец в символ и использовал hunspell
для определения слов с ошибками в каждой строке.
library(hunspell)
df1$Text <- as.character(df1$Text)
df1$word_check <- hunspell(df1$Text)
Я пытался
df1$suggest <- hunspell_suggest(df1$word_check)
но он продолжает выдавать эту ошибку:
Error in hunspell_suggest(df1$word_check) :
is.character(words) is not TRUE
Я новичок в этом, поэтому я не совсем уверен, как получится столбец подсказок, использующий функцию hunspell_suggest
. Любая помощь будет принята с благодарностью.