Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

0 голосов
1 ответ

Я хочу рассчитать среднее значение для каждого города (группового города), используя RDD и данные....

Gyu-lim Shim / 14 мая 2019
0 голосов
1 ответ

Как только работа отправляется в livy, она создает для нее сеанс.Затем отправьте искру, отправьте...

Sayantan Ghosh / 14 мая 2019
0 голосов
0 ответов

Я отправляю задание на сервер livy для запуска нескольких приложений в кластере спарк. Но когда...

Sayantan Ghosh / 14 мая 2019
2 голосов
1 ответ

Я пытаюсь перечислить все объекты в корзине, а затем прочитать некоторые или все из них как CSV.Я...

Andy / 14 мая 2019
1 голос
1 ответ

Предположим, у меня есть следующий DataFrame: import pandas as pd import numpy as np np.random

pault / 14 мая 2019
1 голос
1 ответ

У меня есть данные textFile, которые выглядят как 28.225.37.170 - - [14/May/2019:00:00:05 +0000]...

moez skanjii / 14 мая 2019
0 голосов
1 ответ

Я использую PySpark на AWS Glue.Появляется при записи набора данных со столбцом даты, используемым...

Jiew Meng / 14 мая 2019
0 голосов
1 ответ

Я хотел бы разделить мой RDD относительно запятых и получить доступ к предопределенному набору...

maxime rosano / 14 мая 2019
6 голосов
0 ответов

Я работаю со Spark в Zeppelin в среде совместной работы.Таким образом, у нас есть только один...

Igor Uchôa / 14 мая 2019
0 голосов
0 ответов

Я использую Spark 2.1 и хочу записать список Person в качестве dataframe.Person класс имеет...

Tom / 14 мая 2019
1 голос
1 ответ

HIVE_CANNOT_OPEN_SPLIT: Ошибка при открытии Hive split s3: // путь / к / файлу / .snappy.parquet:...

Etisha / 14 мая 2019
0 голосов
2 ответов

Я передаю фрейм данных в функцию.Иногда это фрейм данных Pandas, а иногда это фрейм данных Spark

Bill Qualls / 14 мая 2019
0 голосов
0 ответов

Выполняя задание на sparkJobServer с помощью команды curl, я сталкиваюсь с этой ошибкой исключения...

Srijan Gupta / 14 мая 2019
0 голосов
1 ответ

Если я остановлю существующий сеанс Spark с именем spark с помощью spark.stop(), что произойдет с...

Joe / 14 мая 2019
0 голосов
2 ответов

Когда я пытаюсь создать фрейм данных со схемой в приведенном ниже коде, он не работает, и если это...

Sainath / 14 мая 2019
1 голос
0 ответов

У меня есть задание spark (spark 2.1), которое обрабатывает потоковые данные, используя прямой...

Liz / 14 мая 2019
0 голосов
0 ответов

Я использую AvroIO из Apache Beam с Spark Runner.Я определил запись avro с полем { "name"...

Anuj J / 14 мая 2019
0 голосов
1 ответ

Этот вопрос является почти точной копией требования здесь: Запись файлов в локальную систему с...

knowone / 14 мая 2019
0 голосов
0 ответов

У меня есть ноутбук, основанный преимущественно на Python, и теперь я хочу интегрировать некоторые...

user1371314 / 14 мая 2019
1 голос
0 ответов

Я следовал этому примеру для вычисления TFIDF каждого слова в моих документах.Однако мой...

scarface / 13 мая 2019
0 голосов
1 ответ

Я создал набор данных Spark из CSV-файла. Схема: |-- FirstName: string (nullable = true)<br>...

CoolBird / 13 мая 2019
0 голосов
1 ответ

Попытка подключения к Hbase с использованием искры на основе приведенной ниже документации,...

William R / 13 мая 2019
0 голосов
1 ответ

Я использовал LDA для поиска темы ref: из pyspark.ml.clustering import LDA lda = LDA (k = 30, seed...

Arun Gunalan / 13 мая 2019
2 голосов
1 ответ
0 голосов
0 ответов

У меня есть очень простое и простое приложение, в котором у меня есть тема1 и тема2, потоковое...

Jay Cee / 13 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...