Мне нужно прочитать паркетные файлы, хранящиеся в HDFS (у меня есть кластер Hadoop, защищенный Kerberos) в моей R-программе.Я натолкнулся на пару пакетов, но ни один из них не удовлетворяет полностью то, что мне нужно
- rhadoop : похоже на старый проект без дальнейшей разработки.Пакет rhdfs в этих библиотеках не поддерживает файлы паркета или Kerberos.
- стрелка : кажется, что он может читать файлы паркета, но нет подключения к HDFS
Есть ли какая-либо другая библиотека, которая позволяет мне читать файлы паркета из HDFS в R?
Я знаю о sparklyr, но считаю, что мне нужно установить spark на машину, которая работаетводитель искры?Это правильно?Мой клиент R - это другая машина.