В качестве альтернативы OpenOffice поставляется со словарем, записи которого хранятся в текстовом файле.Вы можете прочитать это и удалить определения слов, чтобы создать свой список слов.
Это было проверено на v3.0;расположение файла может измениться, а имя файла будет меняться в зависимости от того, какой словарь вы хотите.
library(stringr)
dict <- readLines("C:/Program Files/OpenOffice.org 3/share/uno_packages/cache/uno_packages/174.tmp_/dict-en.oxt/th_en_US_v2.dat")
is_word <- str_detect(dict, "^[^(]")
words <- str_split_fixed(dict[is_word], "\\|", 2)
words <- words[,1]
Этот список содержит несколько словосочетаний.Вы можете предпочесть разделить на первый пробел и принять уникальные значения.Возможно, вы также захотите записать words
в файл, чтобы избежать повторения.
Как только это будет сделано, проверить слово так же просто, как
c("persnickety", "sqwrzib") %in% words # TRUE FALSE