Почему beeline жалуется на IP, когда я использую DNS в соединении?У меня есть действующий...
У меня есть докер-контейнер с установленным JupyterHub, работающий на кластере AWS, как описано...
код Python, который мне нужно преобразовать в PySpark, но я новичок в PySpark (SQL).Я пытаюсь...
У меня есть фрейм данных в scala spark как категория |оценка | A |0,2 А |0,3 A |0,3 B |0,9 B |0,8 B...
Запуск процесса hiveserver2 (v3.0.0 hive) на ec2 (не emr), процесс запускается и в течение первых 1...
Мой текущий подход для оценки различных параметров для LinearSVC и получения наилучшего: tokenizer...
AWS Glue создает сценарии ETL для преобразования, выравнивания и обогащения данных.Код генерируется...
Я нашел несколько похожих решений, но ни одно из них не достигло именно того, что я хочу.У меня...
У меня есть базовый код Spark - Kafka, я пытаюсь запустить следующий код: import org.apache.spark
В моем программном скрипте Python / Spark у меня есть logger = logging.getLogger(results.app_name)...
При попытке синхронизировать файл sbt через IntelliJ с зависимостями "org.apache.spark"...
В чем разница между протоколом отправки приложений REST и традиционным протоколом отправки для...
Не могли бы вы помочь мне выяснить, что именно происходит после развертывания EMR Шаг в кластер с...
У меня есть Rdd[(Int, BreezeDenseMatrix)] и Rdd[(Int, BreezeDenseMatrix)], которые я хочу...
У меня проблемы с составлением запроса, который фильтрует существующий фрейм данных, чтобы показать...
Я пытаюсь запустить этот проект , я добавил зависимость в файл sbt, Мой файл sbt выглядит так: name...
У меня есть Rdd[(Int, BreezeDenseMatrix[Double])] и Rdd[(Int, BreezeVector[Boolean])], размер...
Я пытаюсь запустить Hello_world в Scala, я установил Scala и спарк с sbt. но когда я проверяю scala...
Я пытаюсь запустить простую работу с помощью spark submit. Я делаю так: spark-submit --class com.my
У меня есть два Rdd[(Int, BreezeDenseMatrix[Double])], и я хочу сравнить их. Скажем, что Rdd_1...
Я работаю над очень общим случаем регулярных выражений в scala / java. У меня очень большой набор...
Я пытаюсь использовать некоторый код Scala в Zeppelin 0.8.0 с интерпретатором Spark: %spark import...
У меня есть установка Spark Standalone Cluster на машине EC2. Кластер содержит в общей сложности 1...
Используя Apache Spark, мне стало интересно, действительно ли это ценный производственный тест и на...
Недавно я переместил свой код с python на scala и создал проект со средой scala, включая spark, я...