Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

0 голосов
1 ответ

У меня есть словарь с именем «Word_Count», ключ - это слово, а значения - числовое слово в тексте

tfirinci / 25 февраля 2019
0 голосов
1 ответ

Я пытаюсь отфильтровать мой фрейм данных pyspark следующим образом: у меня есть один столбец,...

LN_P / 25 февраля 2019
0 голосов
0 ответов

Кто-нибудь понимает, почему на моем компьютере Mac OS X не удалось запустить оболочку Spark для...

arilwan / 25 февраля 2019
0 голосов
1 ответ

Мне нужно проверить каждый столбец фрейма данных с ожидаемой длиной или нет.Если нет, необходимо...

Prabu K / 25 февраля 2019
0 голосов
2 ответов

У меня есть объединение двух абсолютно одинаковых подзапросов.Однако, исходя из объяснения запроса,...

Joe C / 23 февраля 2019
0 голосов
0 ответов

Я использую Spark 2.3.1 и язык программирования как Java 8. Пытаюсь подключиться к Твиттеру и...

Brijesh / 23 февраля 2019
0 голосов
1 ответ

Во-первых, я новичок в python и spark, поэтому вопрос может быть немного глупым.Вот оно: Я пытался...

Abhishek / 23 февраля 2019
0 голосов
1 ответ

Согласно документации pyspark , repartition должен использовать хеш-разбиение, что даст несколько...

Isaac / 23 февраля 2019
0 голосов
0 ответов

Я пытаюсь выяснить, как применить foreach к примеру подсчета слов в pyspark, потому что в моем...

Boudewijn Aasman / 22 февраля 2019
0 голосов
1 ответ

Чего мне не хватает в сериализации крио? Class1 и Class3 не являются сериализуемыми классами java...

RLM / 22 февраля 2019
0 голосов
1 ответ

Я только начинаю со Spark.Пытаюсь подсчитать количество упоминаний для каждого токена в твитах.Для...

dataxo / 22 февраля 2019
0 голосов
1 ответ

Я нашел этот ответ Получить строку, соответствующую последней отметке времени в наборе данных Spark...

Prakash Shelke / 22 февраля 2019
0 голосов
1 ответ

1) Я делаю PCA на 9570 столбцах, предоставляя ему 12288 МБ ОЗУ в локальном режиме (что означает...

Des0lat0r / 22 февраля 2019
0 голосов
0 ответов

Я хочу интегрировать Apache Kafka и Spark Streaming, я использую spark-streaming-kafka-0-8_2.11, я...

lempika / 22 февраля 2019
0 голосов
0 ответов

Я новичок в использовании искры и пытаюсь получить огромные данные (4 миллиона записей) через искру...

avinash / 22 февраля 2019
0 голосов
2 ответов

Учитывая следующую таблицу, вопрос состоит в том, чтобы найти, например, верхний N C2 из каждого C1

Joe C / 22 февраля 2019
0 голосов
1 ответ

У меня проблема с запуском SQL-запроса Spark, в котором используется вложенный выбор с предложением...

michszm / 21 февраля 2019
0 голосов
1 ответ

Я переношу свою базу данных с SQL Server на MariaDB, но у меня возникают проблемы с ограничением...

MrCaracara / 21 февраля 2019
0 голосов
0 ответов

Какова роль Param MaxIter ?Это максимальное количество итераций для запуска алгоритма оптимизации

luque Y / 21 февраля 2019
0 голосов
0 ответов

Поэтому я пытаюсь разработать некоторый код на PyCharm, но продолжаю сталкиваться с ошибкой «Нет...

Leon Pham / 21 февраля 2019
0 голосов
1 ответ

У меня есть датафрейм с 4 миллионами строк и 10 столбцами.Я пытаюсь записать это в таблицу в...

sectechguy / 20 февраля 2019
0 голосов
0 ответов

У меня есть файл hdfs со следующими данными key1=value1 key2=value2 key3=value3... key1=value11...

Dharanidhar / 20 февраля 2019
0 голосов
0 ответов

У меня есть модель ML, использующая спарк (запускается каждые 2 часа) и еще одно задание в режиме...

harikamireddi / 20 февраля 2019
0 голосов
0 ответов

Я пытаюсь запустить симуляцию в python с использованием искрового кластера, который принимает форму...

Josh / 20 февраля 2019
0 голосов
0 ответов

Я работаю над Spark SQL (2.2) с использованием Spark Java API. RDD.first() или RDD.take(1) дает...

HamidOvic / 20 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...