Я использую структурированные потоковые записи загрузки из Redis, код ниже val image = spark
Мне нужно сопоставить список столбцов с другим столбцом в наборе данных Spark: подумайте как-то так...
Я проверяю функциональность pandas_udf для сгруппированной карты с pyspark, которая запускается как...
Использование приведенной ниже команды на моем экземпляре AWS EC2 с запущенным PySpark. final_rdd
Я делаю Spark App, но застрял в переменной вещания.Согласно документу, широковещательная переменная...
У меня две таблицы сгруппированы по одним и тем же столбцам, но при объединении обеих таблиц по...
Что я сделал (Структурированный поток) > 1.) ./bin/pyspark > 2.) spark > 3.) static =...
У меня есть функция python, которую я преобразовал в функцию Pandas_UDF, и она работала до...
Я хочу выполнить поиск на myMap. Когда значение col2 равно «0000», я хочу обновить его значением,...
Я пытаюсь читать данные из Кафки, используя структурированную потоковую передачу.Данные, полученные...
Я использую Spark-Streaming 2.2.1 на производстве, и в этом приложении я читаю данные из RabbitMQ и...
Я запускаю задание spark sql со следующими настройками. - executor-cores 2 \ --executor-memory 15g...
Как подключить выходные слова в Power BI Dashboard? Это мой потоковый код Spark: val ssc = new...
У меня есть df с большим количеством столбцов, но моя проблема с двумя столбцами: val df =...
У меня есть входной файл размером 260 ГБ, и мой объем памяти искрового кластера составляет 140 ГБ,...
У меня есть приложение Spark Structured Streaming, которое принимает сообщения из нескольких тем...
Я использую потоковую обработку искры для обработки данных с конфликтующей платформы и записи в...
Я не хочу считать количество посещений страницы пользователем в сеансе, здесь моя проблема в том,...
Я новичок в Spark и новее в R, и пытаюсь выяснить, как "включить" другие R-скрипты при запуске...
Я новичок в Spark и работаю над созданием DataFrame из таблицы базы данных Postgres через JDBC,...
Я добавил два кадра данных к некоторому местоположению s3, и при чтении одного из столбцов в выводе...
Я пытаюсь прочитать данные из таблицы Hive, используя spark sql (scala), и выдает ошибку: ERROR...
У меня есть простой массив json, и я могу читать его в spark-dataframe. Можете ли вы помочь...
У меня есть простое требование, когда у меня есть Dataframe только с одним строковым полем с очень...
В настоящее время я использую Spark с DataFrames для создания серии запросов HTTP GET для каждой...