DirSource возвращает ошибку пустой директории, несмотря на правильный путь к файлу - PullRequest
0 голосов
/ 25 сентября 2018

Это кажется очень простой проблемой.Путь к файлу действителен, и я могу открыть файл, используя другие средства в R, но я ищу использовать библиотеку tm.

docs <- Corpus(DirSource("C:/Users/xyz/Work/test.corpus.txt"), encoding = "UTF-8"))

Выдает ошибку:

Error in inherits(x, "Source") : empty directory

РЕДАКТИРОВАТЬ:

Это работает с оригинальным методом:

docs <- Corpus(DirSource("C:/Users/xyz/Work/"), encoding = "UTF-8"))

Очевидно, вы не можете указать отдельное имя файла.Решение состоит в том, чтобы прочитать файл другим методом, а затем использовать другой тип источника, например VectorSource.

1 Ответ

0 голосов
/ 28 сентября 2018

Вы можете указать шаблон так, чтобы DirSource выбирал только файлы с этим шаблоном.pattern = ".txt" для всех текстовых файлов.Или, если хотите, pattern = "test.corpus.txt".Что-то вроде ниже.

docs <- Corpus(DirSource("C:/Users/xyz/Work/", pattern = "test.corpus.txt", encoding = "UTF-8")
...