Вопросы с тегом апаш-искровой SQL - PullRequest

Вопросы с тегом апаш-искровой SQL

0 голосов
0 ответов

У меня есть 2 кадра данных. df1: |AusID|ProjectId| +-----+---------- |529 |20034 | |973 |20035 |...

Waqar Ahmed / 27 июня 2018
0 голосов
1 ответ

Я работаю с версией Pyspark 2.3.0. я фильтрую фрейм данных в столбце метки времени. | - requestTs:...

sparkly / 27 июня 2018
0 голосов
2 ответов

Входной DF: id . sub_id . id_created . id_last_modified sub_id_created . lead_ 1 . 10 12:00 7:00...

vikky / 27 июня 2018
0 голосов
1 ответ

В моем rdd есть два строковых элемента: «53 45 61», «0 1 2». Я хотел бы сжать и отобразить его...

unchained / 27 июня 2018
0 голосов
1 ответ
0 голосов
1 ответ

У меня есть два кадра данных (более 1 млн записей). Только ~ 10% строк отличаются. Я знаю, как...

max04 / 26 июня 2018
0 голосов
0 ответов

как загрузить файл CSV, если несколько столбцов содержат несколько запятых между ними с...

Raj Kamal / 26 июня 2018
0 голосов
1 ответ

У меня есть DataFrame df со столбцом, который содержит значения Double. Мне удалось вычислить...

Nakeuh / 26 июня 2018
0 голосов
2 ответов

Я хотел бы уменьшить значения определенного столбца в кадре данных на основе предварительно...

Andreyn / 26 июня 2018
0 голосов
2 ответов

Изначально у меня есть матрица 0.0 0.4 0.4 0.0 0.1 0.0 0.0 0.7 0.0 0.2 0.0 0.3 0.3 0.0 0.0 0.0...

PRIYA M / 26 июня 2018
0 голосов
0 ответов

Я пытаюсь вычислить матрицу сходства пользователей по их метаданным.После этого вопроса я нашел...

Aziz Ilyosov / 26 июня 2018
0 голосов
1 ответ

Я читаю исходный код spark.sql.execution.datasources.jdbc.JDBCRelation. Вот комментарий к исходному...

John Hass / 26 июня 2018
0 голосов
0 ответов

Мы используем MapR FS со скользящими томами, и необходимо выровнять файлы секционированного...

ChernikovP / 25 июня 2018
0 голосов
0 ответов

У меня есть следующая функция: def timestampConverter(dt: String): Option[Int] = { val timeStamp =...

Tomasz Krol / 25 июня 2018
0 голосов
1 ответ

как обрабатывать недостающие типы объектов JSON при чтении JSON в DF в искре в класс case case...

Vamsi / 25 июня 2018
0 голосов
1 ответ

Обычный искровой фрейм данных позволяет получить доступ к sparksession через df.sparksession class...

Georg Heiler / 25 июня 2018
0 голосов
2 ответов

У меня есть DataFrame, созданный с помощью HiveContext, где один из столбцов содержит записи вроде:...

Rajdip / 25 июня 2018
0 голосов
1 ответ

У меня есть следующий DataFrame df +-----------+-----------+-----------+...

ScalaBoy / 25 июня 2018
0 голосов
2 ответов

Я пытаюсь сохранить потоковые данные в HDFS с помощью SparkStreaming, но он продолжает создавать в...

andani / 25 июня 2018
0 голосов
1 ответ
0 голосов
1 ответ

Мне нужно преобразовать следующее выражение scala в python: scala> a.join(b, a("key")...

Gerrie van Wyk / 25 июня 2018
0 голосов
0 ответов

Недавно я использовал spark 2.2 для запроса огромного кластера эластичного поиска с 3 узлами и 1000...

AI Joes / 25 июня 2018
0 голосов
0 ответов

Каков наилучший способ реализации ROW_NUMBER (генератор последовательности) в программе Spark для...

Arvind Kumar / 25 июня 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...