Короткое выражение lapply
для удаления не-ascii символов из списка пользовательских комментариев прекрасно работает в Linux (Xubuntu), но выдает ошибку embedded nul in string
в Windows. Оба компьютера работают под управлением R 3.5.1.
У меня есть список комментариев пользователей (свободный текст), и я использовал:
comments <- lapply(comments, iconv, "ascii", sub="")
, который удачно удаляет любые символы, не относящиеся к ascii в Linux. Я пытаюсь выполнить эту команду для следующего фрагмента текста:
"Referring to an afternoon at ​80 Mawson Arms..."
R в Linux удаляет символ ​80
- досадно, я не могу понять, каким должен быть этот символ - но Windows выдает эту ошибку:
Error in FUN(X[[i]], ...) :
embedded nul in string: 'Referring to an afternoon at C"b\002,b\0980 Mawson Arms..."
Тот факт, что он не просто удаляет символ ​80
, заставляет меня думать, что он воспринимает его как нечто конвертируемое в Windows, но не в Linux. Кто-нибудь может пролить свет на это?