Изменение содержимого data.table с помощью нескольких регулярных выражений - PullRequest
0 голосов
/ 27 мая 2019

У меня есть dt = data.table со столбцом символов.

Мне нужно выполнить несколько операций с регулярными выражениями над этим столбцом, которые я записал как:

  dt[, Description := sapply(Description, tolower)][
      , Description := sapply(Description, gsub, pattern = " $", replacement = "")][
        , Description := sapply(Description, gsub, pattern = "  ", replacement = " ")][
          , Description := sapply(Description, gsub, pattern = "ões\\>", replacement = "ão")][
            , Description := sapply(Description, gsub, pattern = "eis\\>", replacement = "el")][
              , Description := sapply(Description, gsub, pattern = "as\\>", replacement = "a")][
                , Description := sapply(Description, gsub, pattern = "ais\\>", replacement = "al")][
                  , Description := sapply(Description, gsub, pattern = "es\\>", replacement = "e")][
                    , Description := sapply(Description, gsub, pattern = "ns\\>", replacement = "m")][
                      , Description := sapply(Description, gsub, pattern = "s\\>", replacement = "")]

Это в основном всеспособы замены множественного числа на единственное в португальском.

Есть ли более эффективный и элегантный способ сделать это?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...