Я пытаюсь настроить свою среду R для запуска алгоритмов H2O в кластере YARN. (не имеют доступа к...
Я создал этот минимальный рабочий пример. Сначала он создает фрейм данных, и нам нужна простая...
Я записываю фрейм данных spark в локальную файловую систему в виде файла csv с помощью функции...
Я задал тот же вопрос здесь и получил хороший ответ для dplyr, но теперь я хочу сделать то же самое...
Я хочу использовать возможности библиотеки ТМ в sparklyr.Я использовал функцию spark_apply() для...
Понятия не имею, почему я получаю эту ошибку.Я погуглил, но ничего не нашел .. Мой код немного...
Я перепробовал многие вещи, данные в интернете, но мне ничего не помогло ... Если вы знаете, как...
Я использую Spark v2.2.1 через sparklyr v0.6.2 и извлекаю данные из SQL Server через jdbc.Кажется,...
Рассмотрим этот простой пример, который обучает модель naive bayes некоторым текстовым данным....
Рассмотрим этот простой пример dtrain <- data_frame(text = c("Chinese Beijing Chinese"...
> data2_tbl <- copy_to(sc, FB_tbl) #sc as spark connection > idx <- tk_index(data2_tbl)...
У меня есть функция R с более чем одним аргументом, и я использую функции dplyr. Теперь я хочу...
Для фреймов данных Spark в sparklyr я знаю, что NA может быть вменено фиксированным числом,...
Рассмотрим этот простой пример, в котором используется sparklyr: library(sparklyr)...
В R оператор целочисленного деления равен %/%;однако, это не работает правильно в кадре данных...
Я пытаюсь добавить в мой Spark DataFrame столбец с серийным номером на основе условия: я хотел бы...
Ниже приведен пример кода R.Я хотел бы сделать то же самое в sparklyr. custTrans1 <- Pdt_table...
У меня странные проблемы при работе Spark с sparklyr. В настоящее время я на производственном...
Мы переходим к AWS EMR / S3 и используем R для анализа (sparklyr библиотека).У нас есть данные о...
Рассмотрим следующий пример dtrain <- data_frame(text = c("Chinese Beijing Chinese",...
У меня есть производственный кластер R с установленным Rstudio.Пользователи сбалансированы по...
Я использую sparklyr для манипулирования некоторыми данными.Учитывая, a<-tibble(id = rep(c(1,10)...
Я начал использовать sparklyr для обработки данных большого размера, поэтому мне нужно использовать...
У меня есть набор данных, как показано ниже. Из-за большого объема данных я загрузил его через...
Это код, который я использовал в R через Spark Cluster, и ошибка также приведена ниже...