Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Вопрос 1. Я работаю над задачей классификации с фреймом данных размером 56 000 записей и 2100...

godspeed / 24 сентября 2018
0 голосов
0 ответов

Позвольте быть работой, которая содержит две фазы, которые (для удобства) не могут быть объединены

belka / 24 сентября 2018
0 голосов
1 ответ

После борьбы с зависимостями регистратора я наконец успешно запустил приложение весенней загрузки с...

Stefania / 24 сентября 2018
0 голосов
1 ответ

У меня есть скрипт ниже (я удалил все имена столбцов и т. Д., Чтобы было проще увидеть, что я делаю...

kikee1222 / 24 сентября 2018
0 голосов
1 ответ

У меня есть класс модели Scala, объект которого я хочу сохранить в таблице Cassandra. Существует...

shantha ramadurga / 24 сентября 2018
0 голосов
0 ответов

По умолчанию YARN агрегирует журналы после завершения приложения.Но я пытаюсь объединить журналы...

Ayush Chauhan / 24 сентября 2018
0 голосов
2 ответов

Я использую Scala для запуска этого проекта , код выглядит следующим образом: package com

Aaditya Ura / 24 сентября 2018
0 голосов
1 ответ

У меня есть датафрейм, который выглядит следующим образом: df: col1 col2 a [p1,p2,p3] b [p1,p4]...

user1337 / 24 сентября 2018
0 голосов
1 ответ

У меня есть датафрейм id lat long lag_lat lag_long detector lag_interval gpsdt lead_gpsdt 1 12 13...

experiment / 24 сентября 2018
0 голосов
1 ответ

У меня есть фрейм данных со столбцом массива. val json = """[ {"id": 1,...

Oleg Pavliv / 24 сентября 2018
0 голосов
2 ответов

Я новичок в скале.Пожалуйста, наберитесь терпения. У меня есть этот код. import org.apache.spark

kaileena / 24 сентября 2018
0 голосов
1 ответ

Быстрый вопрос, просто пытаясь понять, что именно означает spark.sql.shuffle.partitions?Говорим ли...

MaatDeamon / 24 сентября 2018
0 голосов
0 ответов

Это док-файл искры с centos7.Я искал команду выполнения, которая используется в супервизоре, чтобы...

VAIBHAV SHUKLA / 24 сентября 2018
0 голосов
0 ответов

Я использую Spark 2.3, и меня смущает интеграция Spark SQL и Hive. Spark SQL поддерживает множество...

Tom / 24 сентября 2018
0 голосов
2 ответов

У меня есть 2 кадра данных: |data | |--------------| |[1,Rob,12] | |[2,Jeremy,11] | |[3,Bart,14] |...

partsBar / 24 сентября 2018
0 голосов
3 ответов

У меня есть фрейм данных следующего формата: name merged key1 (internalKey1, value1) key1...

pirox22 / 23 сентября 2018
0 голосов
0 ответов

RDD.sparkContext имеет setJobGroup: myRdd.sparkContext.setJobGroup("standardizationPipeline

javadba / 23 сентября 2018
0 голосов
1 ответ

В HDFS у меня есть такие каталоги, как этот hdfs: // имя хоста / данные / канал / данные / dt =...

kikee1222 / 23 сентября 2018
0 голосов
0 ответов

У меня есть набор данных транзакции, который я готовлю к val df = spark.read.parquet(".

Alexander Mazitov / 23 сентября 2018
0 голосов
1 ответ

Я использую вложенную структуру данных (массив) для хранения многозначных атрибутов для таблицы...

Abir Chokraborty / 23 сентября 2018
0 голосов
1 ответ

У меня есть следующая схема данных: root |-- firstname: string (nullable = true) |-- lastname:...

MateuszDlugosz / 22 сентября 2018
0 голосов
2 ответов

Мне нужно отфильтровать только текст, начинающийся с> в столбце. Я знаю, что есть функции setsWith...

Hussain Asghar / 22 сентября 2018
0 голосов
1 ответ

Я использую spark 2.2 и пытаюсь прочитать набор данных из файла tsv, как показано ниже в pyspark:...

Kamal Nandan / 22 сентября 2018
0 голосов
0 ответов

У меня есть список больших двоичных объектов (wasbs url) в структурированном фрейме потоковых...

user2119453 / 22 сентября 2018
0 голосов
0 ответов

Каков максимальный размер spark.broadcast (var), где var - это пустой массив?Я видел это...

momo / 22 сентября 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...