Вопросы с тегом апаша-искра - PullRequest

Вопросы с тегом апаша-искра

0 голосов
1 ответ

У меня есть набор данных case class MyDS ( id: Int, name: String ) Я хочу получить все имена в...

Ankit / 27 июня 2019
0 голосов
0 ответов

Я запускаю процедуру предварительной обработки с помощью pyspark в локальном режиме на 12-ядерном...

Dae Hyun Lee / 27 июня 2019
0 голосов
1 ответ

Я использую scala и пытаюсь записать файл со строковым содержимым в S3.Я пытался сделать это с...

Ben Haim Shani / 27 июня 2019
1 голос
1 ответ

У меня есть последовательность кортежей, через которые я сделал RDD и преобразовал это в dataframe....

user3190018 / 26 июня 2019
1 голос
2 ответов

У меня миллионы строк в виде фрейма данных, например: val df = Seq(("id1",...

user811602 / 26 июня 2019
1 голос
2 ответов

Невозможно распознать функцию avg и over в IntelliJ. Это говорит, что не может разрешить символ avg...

Rittik De / 26 июня 2019
0 голосов
1 ответ

У меня небольшая проблема.Я хотел бы удалить любую строку, содержащую «NULL». Это мой входной файл:...

Amel ha / 26 июня 2019
0 голосов
0 ответов

Я пытаюсь использовать сумму после groupBy, например, val b = a.groupBy($"key")

MetallicPriest / 26 июня 2019
0 голосов
1 ответ

Мы используем DataStax Spark 6.0. Мы отправляем задания, используя crontab для запуска каждые 5...

Hyder Tom / 26 июня 2019
0 голосов
1 ответ
0 голосов
0 ответов

Свойство репликации Hadoop не работает из кода зажигания У меня есть сценарий использования, для...

Divya / 26 июня 2019
0 голосов
1 ответ

Я пытаюсь сгруппировать указанный ниже набор данных на основе столбца «id» и поэлементно...

Prem Kumar / 26 июня 2019
0 голосов
2 ответов

Вопросы, связанные с ядрами и исполнителями, задаются несколько раз в SO. Apache Spark: количество...

user805 / 26 июня 2019
0 голосов
0 ответов

У меня есть работа Spark, написанная на Scala, которая в конечном итоге записывается в AWS DynamoDB

soapergem / 26 июня 2019
0 голосов
1 ответ

Ниже приведен мой код, и когда я пытаюсь перебрать каждую строку: val df: DataFrame = sqlContext

user3897533 / 26 июня 2019
4 голосов
2 ответов

У меня довольно большой набор данных (100 миллионов + записей с сотнями столбцов), которые я...

Sai Kiran KrishnaMurthy / 25 июня 2019
0 голосов
2 ответов
2 голосов
0 ответов

При выполнении следующего фрагмента кода возникает ошибка преобразования mtcars_tbl в h2o dataframe...

arlugones / 25 июня 2019
0 голосов
1 ответ

Я работаю над проектом spark в IDE затмения, используя scala Мне нужна помощь с этой проблемой...

Amel ha / 25 июня 2019
1 голос
0 ответов

У меня есть следующий набор данных, в настоящее время использующий UDF для суммирования массивов

prabuster / 25 июня 2019
1 голос
2 ответов

Когда я пытаюсь прочитать файл паркета из указанного места, например / test, с помощью spark.read

Hypnotise / 25 июня 2019
0 голосов
0 ответов

У меня есть задание PySpark, которое я отправляю в Livy с помощью Python-клиента . Я бы хотел...

Bolchojeet / 25 июня 2019
0 голосов
0 ответов

Я недавно установил Spark 2.4.3 и получаю следующее исключение при попытке запустить pyspark и не...

ahajib / 25 июня 2019
0 голосов
2 ответов

у меня есть следующая схема свечей данных root |-- UserId: long (nullable = true) |--...

Arash / 25 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...