Как читать паркетные файлы из HDFS в R - PullRequest
1 голос
/ 25 сентября 2019

Мне нужно прочитать паркетные файлы, хранящиеся в HDFS (у меня есть кластер Hadoop, защищенный Kerberos) в моей R-программе.Я натолкнулся на пару пакетов, но ни один из них не удовлетворяет полностью то, что мне нужно

  • rhadoop : похоже на старый проект без дальнейшей разработки.Пакет rhdfs в этих библиотеках не поддерживает файлы паркета или Kerberos.
  • стрелка : кажется, что он может читать файлы паркета, но нет подключения к HDFS

Есть ли какая-либо другая библиотека, которая позволяет мне читать файлы паркета из HDFS в R?

Я знаю о sparklyr, но считаю, что мне нужно установить spark на машину, которая работаетводитель искры?Это правильно?Мой клиент R - это другая машина.

...