Прочитайте большой .gz файл с SparkR - PullRequest
0 голосов
/ 28 января 2019

Я пытаюсь прочитать большой файл gz, используя:

df= read.delim2(gzfile('route/file.gz', 'r'), sep = '|', header = TRUE, , stringsAsFactor = FALSE , encoding = 'UTF-8' , check.names = F )

Я получаю следующую ошибку:

Error in gzfile("route/file.gz",  : 
  cannot open the connection
In addition: Warning messages:
1: 'sparkR.init' is deprecated.
Use 'sparkR.session' instead.
See help("Deprecated") 
2: 'sparkRSQL.init' is deprecated.
Use 'sparkR.session' instead.
See help("Deprecated") 
3: 'sparkR.init' is deprecated.
Use 'sparkR.session' instead.
See help("Deprecated") 
4: 'sparkRSQL.init' is deprecated.
Use 'sparkR.session' instead.
See help("Deprecated") 
5: In gzfile("route/file.gz",  :
  cannot open compressed file 'route/file.gz', probable reason 'Bad address'

Почему это происходит?и как я могу это решить?

Я использую SparkR

PD: маршрут и имя файла, которое я использую, являются правильными

...