Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

0 голосов
1 ответ

Я пытался объединить два кадра данных, используя следующий список ключей объединения, переданных в...

jayesh / 12 февраля 2019
0 голосов
2 ответов

Работая над улучшением производительности кода, поскольку многие задания не выполнялись (прервано),...

SarahData / 12 февраля 2019
0 голосов
1 ответ

У меня есть скрипт sql, который создает временные таблицы, действительные только для этого сеанса

HariJustForFun / 12 февраля 2019
0 голосов
0 ответов

Я хочу вычислить косинусное сходство в искре для TF-IDF.это код в уроке искры. from pyspark.sql...

Tavakoli / 12 февраля 2019
0 голосов
0 ответов

Я могу сгенерировать exe-файл с помощью плагина maven, и все в порядке. Но когда я добавляю...

Amira Bmansour / 12 февраля 2019
0 голосов
0 ответов

Я пытаюсь понять, как Spark загружает данные из MySQL, читая журнал MySQL.Но я обнаружил, что Spark...

DKD / 12 февраля 2019
0 голосов
1 ответ

Я ищу СДР операцию, такую ​​как like в sql.Скажем, у меня есть столбец с разными IP-адресами,...

slylljyq / 12 февраля 2019
0 голосов
1 ответ

Я хочу сопоставить свои поля меток времени в наборе данных со значениями, такими как...

aiman / 11 февраля 2019
0 голосов
2 ответов

Я хочу создать новый столбец, который является средним значением продаж за предыдущий день,...

Ayush Mishra / 11 февраля 2019
0 голосов
1 ответ

Я новичок в pyspark.У меня есть список столбцов в массиве, как показано ниже. input_vars = [...

Valli69 / 11 февраля 2019
0 голосов
1 ответ

Проверены все предоставленные конфигурации, shuffle spark.default.parallelism,spark.sql.shuffle

Sheel / 11 февраля 2019
0 голосов
1 ответ

Я использую PySpark с Flask, чтобы иметь веб-сервис. #!/usr/bin/env python # -*- coding: utf-8 -*-...

Kaharon / 11 февраля 2019
0 голосов
0 ответов

У меня есть код pyspark, преобразующий фрейм данных pyspark через функцию в несколько фреймов...

toby / 11 февраля 2019
0 голосов
1 ответ

У меня есть столбец int_rate типа string в моем фрейме данных spark, и все его значения похожи на 9

Jdixit / 11 февраля 2019
0 голосов
1 ответ

У меня есть фрейм данных с двумя столбцами, days, указывающий количество дней, в течение которых...

Qubix / 10 февраля 2019
0 голосов
1 ответ

У меня есть агрегированный DataFrame со столбцом, созданным с использованием collect_set.Теперь мне...

shakedzy / 10 февраля 2019
0 голосов
1 ответ

Я использую Drill 1.15 в распределенном режиме только поверх узлов данных (3 узла с 32 ГБ памяти...

Avik Aggarwal / 09 февраля 2019
0 голосов
1 ответ

Я хочу сделать цикл для номеров строк разделов в кадре данных, чтобы проверить условия и создать...

adamcloud / 08 февраля 2019
0 голосов
0 ответов

У меня есть 2 основные таблицы: рейсы и праздники. Полеты идентифицируются по: outboundlegid,...

Jiew Meng / 08 февраля 2019
0 голосов
1 ответ

Ниже приведен пример фрагмента кода pyspark, где я пытаюсь проверить (как проверка...

akhil pathirippilly / 08 февраля 2019
0 голосов
0 ответов

Я пытаюсь загрузить данные из потока kafka в СУБД Oracle и улей, сообщения в Hive записываются...

Abhis / 08 февраля 2019
0 голосов
1 ответ

Я хочу выбрать столбец из CSV-файла, используя только функцию rdd, а не фрейм данных в искре.Я...

SHALIN PATEL / 08 февраля 2019
0 голосов
1 ответ

У меня есть набор данных, который необходимо пересчитать.Для этого мне нужно сгруппировать его по...

João Marcos Araújo do Valle / 08 февраля 2019
0 голосов
0 ответов

Недавно мы обновили метку выпуска EMR с emr-5.16.0 до emr-5.20.0, в которой вместо 2.3.1...

Pedro / 07 февраля 2019
0 голосов
1 ответ

Предположим, у меня есть следующие таблицы в базе данных Oracle Foo: +--------+---------+---------+...

Kerooker / 07 февраля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...