Как классифицировать слова, которые написаны по-разному - PullRequest
0 голосов
/ 03 мая 2019

Если слово WAGONRI написано по-разному, например, WGNRI, WGR, WAG, ABD-WGR1, как мы можем классифицировать написанное слово как WAGONRI

1 Ответ

1 голос
/ 03 мая 2019

Вы можете использовать stringdistance из stringdist, чтобы определить, похожи ли строки, а затем использовать подходящее значение.

stringdist::stringdist("WAGONRI",c("WGNRI","WGR","WAG","ABD-WGR1"))
[1] 2 4 4 7

Если у вас есть несколько слов, каждое из которых написано несколькими различными способамиможет быть проще всего жестко закодировать правила.Используйте, например, if_else

x <- c("WGNRI","WGR","WAG","ABD-WGR1")
if_else(WORD %in% x, "WAGONRI", Something else)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...