Вопросы с тегом апаша-искра

0 голосов

1 ответ

Сбой задания Pyspark в Google Cloud Dataproc

Я создал кластер Dataproc с 1 мастером и 10 узлами.Все они имеют одинаковую конфигурацию процессора...

Bin Lin / 04 июня 2018

0 голосов

1 ответ

Как сделать целочисленное деление (мод) со спарклиром в R?

В R оператор целочисленного деления равен %/%;однако, это не работает правильно в кадре данных...

Wendy / 04 июня 2018

0 голосов

0 ответов

Как проверить, является ли файл действительным gz или нет в Spark или Scala

У меня есть несколько файлов в моей директории HDFS, я хочу обработать их с помощью Spark, но...

sande / 04 июня 2018

0 голосов

2 ответов

Как получить Месос Агенты Framework Executor Память

Внутри веб-интерфейса Mesos я вижу использование памяти моих исполнителей Spark в таблице Agents...

astro_asz / 04 июня 2018

0 голосов

1 ответ

Ошибка загрузки данных в Hbase с использованием базовой библиотеки Hortonrworks shc

Мы использовали кластер EMR для целей разработки, и там я использовал библиотеку ядра,...

PPPP / 04 июня 2018

0 голосов

1 ответ

Соединение двух фреймов данных работало, но теперь происходит сбой при изменении содержимого одного из фреймов данных.

Я делал следующее: выборка фрейма данных из neo4j с помощью neo4j-spark-connector выборка фрейма...

Mahesha999 / 04 июня 2018

0 голосов

1 ответ

Как передать потоковые данные из искры в Mongodb?

Я использую pyspark для чтения потоковых данных из Kafka, а затем хочу передать эти данные в...

Vivek Singh / 04 июня 2018

0 голосов

1 ответ

Добавить новый столбец в Spark DF на основе логики

Необходимо добавить новый столбец ниже DF на основе других столбцов.Вот схема DF scala> a

Arjun / 04 июня 2018

0 голосов

1 ответ

Эффективный буквенно-цифровой поиск sparkR

У меня есть во фрейме данных Spark с 10 миллионами строк, где каждая строка представляет...

Anurag H / 04 июня 2018

0 голосов

1 ответ

Что эквивалентно функции list () в R в sparklyr?

Ниже приведен пример кода R.Я хотел бы сделать то же самое в sparklyr. custTrans1 <- Pdt_table...

Jennifer Therese / 04 июня 2018

0 голосов

1 ответ

Как сканировать столбец, чтобы получить новый столбец в Pyspark DataFrame

У меня есть Pyspark DataFrame с двумя столбцами: sendtime и charge_state, если обвинение_state...

Mr. Young / 04 июня 2018

0 голосов

1 ответ

взорвать Key-Values в пару ключ-значение scala

У меня есть 3 строки для ввода, которые имеют ключ и значения сгруппированы.Теперь нужно...

ASR RAJ / 03 июня 2018

0 голосов

2 ответов

Написать столбец на основе соединения DataFrame

Допустим, у меня есть два кадра данных - df1 и df2 - оба с колонками foo и bar.Столбец foo - это...

ghukill / 03 июня 2018

0 голосов

0 ответов

автономный кластер apache spark - spark-submit - ConnectException: вызов из ubuntu / 127.0.1.1 в ubuntu: сбой 9000

Когда я пишу код в Intellij и spark 2.3.0 с master ("local") и выполняю в Intellij, я получаю вывод

Raghav / 03 июня 2018

0 голосов

0 ответов

Применяется ли переменная окружения PYSPARK_PYTHON только для вошедшего в систему пользователя?

Это может быть больше вопросом Linux, но я запускаю задание Pyspark с UDF, который зависит от...

SherMM / 03 июня 2018

0 голосов

0 ответов

PySpark Rdd в Dataframe очень медленно

У меня есть фрейм данных, который в какой-то момент я конвертирую в rdd для выполнения...

jrgn / 02 июня 2018

0 голосов

1 ответ

Как заполнить значения Dataframe на основе данных в другом dataframe

Lookup DF: +--------------------+------------------+ | seller_name| codes|...

Arjun / 02 июня 2018

0 голосов

1 ответ

Настройка log4j2.properties для установки определенного уровня журнала только для Spark

Я обновляю log4j своего рабочего проекта до log4j2 и пытаюсь понять некоторый синтаксис, который...

CubemonkeyNYC / 02 июня 2018

0 голосов

0 ответов

Как я могу очистить эту цитату "" "" "в Spark, используя DataFrame.csv?

val df = spark.read.format("csvz") .option("header", "true")

Luciane Carvalho / 02 июня 2018

0 голосов

0 ответов

Оптимизируйте размер выборки на разъеме Spark Couchbase

Я использую spark, чтобы соединить таблицу с другой базой данных и couchbase, используя наборы...

Hohenheimsenberg / 02 июня 2018

0 голосов

1 ответ

Concat определенные поля строки String после разделения

У меня есть файл в формате Json, который содержит сотни твитов (у всех 5 полей): [...] {...

Fernando M / 01 июня 2018

0 голосов

1 ответ

Столбец не является членом org.apache.spark.sql.DataFrame

Я новичок в Spark, и я пытаюсь объединить две таблицы, представленные в кусте из кода Scala: import...

ashwini / 01 июня 2018

0 голосов

2 ответов

Какой самый быстрый способ получить большое количество временных диапазонов с помощью Apache Spark?

У меня есть около 100 ГБ данных временных рядов в Hadoop.Я бы хотел использовать Spark для сбора...

adivis12 / 01 июня 2018

0 голосов

1 ответ

Как поддерживать порядок значений при выполнении свертки в искровом Dataframe

Как я могу выполнить сведение нижеследующего фрейма данных, то есть иметь только одну запись для...

Arjun / 01 июня 2018

0 голосов

3 ответов

Spark на K8s - ошибка: режим kube не поддерживает ссылки на приложения в локальной сети

Я пытаюсь настроить спарк-кластер на k8s.Мне удалось создать и настроить кластер с тремя узлами,...

garfiny / 01 июня 2018