RQDA не читает импортированные символы UTF-8 в кодировке UTF-8 .txt - PullRequest
0 голосов
/ 26 мая 2019

Попытка импортировать базу данных текстов для анализа с помощью RQDA. База данных состоит из преобразованных из текста в текст файлов с кодировкой UTF-8. Предполагается, что RQDA читает UTF-8, однако символы UTF-8, такие как (ą, č, ę, ė, į, š,), ū), не распознаются после импорта в RQDA.

Я использую функцию "write.FileList" для импорта. Его детали утверждают, что

"Содержимое файла будет преобразовано в символ UTF-8, прежде чем оно будет записано в * .rqda. Исходное содержимое может быть в любой подходящей кодировке, поэтому вы можете проверить содержимое правильно; Другими словами, рекомендуется использовал соответствующую кодировку (вы можете получить подсказку с помощью функции localeToCharset), чтобы сохранить импортированные файлы. "

write.FileList(FileList, encoding = .rqda$encoding, con = .rqda$qdacon)

addFilesFromDir("C:\\output", pattern = "*.txt$")

write.FileList импортирует базу данных текста в RQDA, но символы UTF-8 не распознаются.

Показывает это предупреждение:

"In rsqlite_fetch (res @ ptr, n = n): Не нужно вызывать dbFetch () для операторов, только для запросов "

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...