Вопросы с тегом искровой dataframe - PullRequest

Вопросы с тегом искровой dataframe

0 голосов
1 ответ

Я могу создать Spark DataFrame с векторным столбцом с помощью метода toDF. val dataset = Seq((1.0,...

Powers / 14 мая 2018
0 голосов
1 ответ

Я прочитал другие связанные вопросы, но не нашел ответа. Я хочу создать DataFrame из класса...

John Hass / 13 мая 2018
0 голосов
1 ответ

У меня есть кадр данных Pandas с одним столбцом, содержащим строковые идентификаторы. Я использую...

user1930106 / 12 мая 2018
0 голосов
1 ответ

Я пытаюсь достичь 80% усеченного значения для каждой группы в скале, чтобы избавиться от выбросов....

ds_user / 12 мая 2018
0 голосов
1 ответ

Как мне получить ключи сгруппированных spark-dataframe? И еще вопрос: Что включает в себя pyspark

Zahra Ghodsi / 12 мая 2018
0 голосов
0 ответов

У меня есть RDD с формой long, int, string, Array[Double], которую мне нужно преобразовать в...

William Sleeman / 12 мая 2018
0 голосов
1 ответ

Я работаю с dstream из kafka, который выглядит как запись ниже. Я изо всех сил пытался получить...

fast-ta / 12 мая 2018
0 голосов
0 ответов

У меня есть датафрейм с датой, счетом, оценкой, жанром и просматриваемыми столбцами. Я пытаюсь...

Masterbuilder / 12 мая 2018
0 голосов
1 ответ

Входные данные: key,date,value 10,20180701,a10 11,20180702,a11 12,20180702,a12 13,20180702,a13 14...

sairam chowdary / 12 мая 2018
0 голосов
1 ответ

Я запускаю Spark в автономном режиме с каталогом Hive.Я пытаюсь загрузить данные из внешнего...

kirylm / 12 мая 2018
0 голосов
1 ответ

Я хочу разделить данные, используя ID, и с каждым разделом я хочу - применить набор операций...

Nandita Dwivedi / 11 мая 2018
0 голосов
0 ответов

Используйте sparkSession. Когда я читаю файл паркета, я получаю следующую ошибку: мой код: val df =...

Shaokai Li / 11 мая 2018
0 голосов
1 ответ

У меня была проблема, которая представляет собой программу for loop. Как показано ниже: list = [1,2...

Zhang Xin / 11 мая 2018
0 голосов
0 ответов

У меня есть кадр данных df1 со столбцом col1, который имеет структуру:...

Vikas J / 10 мая 2018
0 голосов
0 ответов

мои входные данные хранятся в Cassandra, и я использую таблицу, первичным ключом которой является...

Marious / 10 мая 2018
0 голосов
1 ответ

У меня есть фрейм данных, который я записываю в таблицу Hive с использованием partitionBy - val df...

Regressor / 10 мая 2018
0 голосов
2 ответов

Или просто для простоты понимания, у меня есть фрейм данных. DataPartition TimeStamp OrganizationID...

SUDARSHAN / 10 мая 2018
0 голосов
1 ответ

Я получаю логи в формате log4j, обрабатываю их и сохраняю в Spark. Я не в кластерной или...

kumar / 10 мая 2018
0 голосов
2 ответов

Чтобы подвести итог, я пытаюсь запустить тест TPCDS для Spark с оптимизатором катализатора Spark и...

ajaymysore / 10 мая 2018
0 голосов
2 ответов

Я делаю некую агрегацию на созданном мною кадре данных. Вот шаги val initDF = spark.read

Rajesh Ravindran / 10 мая 2018
0 голосов
2 ответов

У меня есть приложение для потоковой передачи с искровым структурированием (прослушивание kafka),...

Brian / 09 мая 2018
0 голосов
2 ответов
0 голосов
1 ответ

Я новичок в программировании Scala, я очень много работал над R, но работая в scala, стало трудно...

B G Manjunath Prasad / 09 мая 2018
0 голосов
1 ответ

Это кажется простой задачей, но я не могу понять, как это сделать с помощью Scala в Spark (не...

ScalaBoy / 09 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...