У меня есть 2 кадра данных Spark library(SparkR); library(magrittr) df1 <- createDataFrame(data
Я хочу дискретизировать переменную, используя R, предпочтительно SparkR, чтобы желаемые результаты...
Я хочу рассчитать сгруппированные процентили, используя SparkR. Я попробовал это library(SparkR)...
Я новичок в SparkR и пробую первые шаги подготовки данных. Набор данных является чем-то в этом роде
У меня есть набор данных ~ 8 ГБ с ~ 10 миллионами строк (около 10 столбцов), и я хотел доказать,...
У меня есть следующий код, который работает в обычном R, но я бы хотел портировать на SparkR, чтобы...
У меня есть во фрейме данных Spark с 10 миллионами строк, где каждая строка представляет...
У меня кластер с запущенным Cloudera CDH.Мне нужно подключить мои R-программы (работающие на моем...
Мне нужно использовать SparkR для какой-то части проекта, обычно я использую scala.Я записываю файл...
Контекст Я работаю над sparkR с CSV-файлами.до работы с spark я работал над R с файлами Excel, и я...
У меня есть следующая проблема: Я делаю sql-запрос по набору файлов паркета в HDFS, а затем собираю...
На моем компьютере с Ubuntu установлены sparkR и R. Когда я пытаюсь запустить sparkR через терминал...
Из R или RStudio под Windows я пытаюсь получить доступ к файлу паркета в удаленном кластере Hadoop:...
У меня есть две отдельные таблицы Hive, в которых я хотел бы запустить очень сложный алгоритм...
Я пытаюсь выполнить SparkR gapply, по сути, когда я пытаюсь запустить это с моим входным файлом,...
Застрял в проблеме SQL для приложений из блока данных, где я пытаюсь определить, какие уникальные...