Как упомянуто автором пакета:
Используется \w
для определения букв, которые определены как [A-Za-z0-9_]
.Вам нужно будет написать свое собственное регулярное выражение для обработки не-ascii букв
ОБНОВЛЕНИЕ:
На моем компьютере с Win 7 вывод будет таким, как ожидалось.
Один извозможные способы ее решения с использованием шаблона "[\\pL_]"
(любое слово на любом языке)
rm_nchar_words("è ûé", "1,2", pattern = "[\\pL_]")
Язык на Win-машине:
locale:
[1] LC_COLLATE=English_United States.1252 LC_CTYPE=English_United States.1252 LC_MONETARY=English_United States.1252
[4] LC_NUMERIC=C LC_TIME=English_United States.1252
Я буду продолжать изучать это и публиковать обновления для моегоответ.
ОБНОВЛЕНИЕ 2:
rm_nchar_words("è ûé", "1,2", pattern = "[\\pL_]")
""
работает на моем Ubuntu 18.04.