Вопросы с тегом апаш-искра - PullRequest

Вопросы с тегом апаш-искра

1 голос
1 ответ

Я использую Spark 2.3.0, у меня есть 2 набора данных, оба они достаточно большие, 400 МБ +.Когда я...

bhushan / 16 мая 2019
0 голосов
1 ответ

Мне нужно перебрать rdd, вынуть данные для обработки и поместить их в буфер списка.Когда я...

guiniao / 16 мая 2019
0 голосов
0 ответов

У меня есть СДР, как показано ниже, и я хотел бы получить доступ к элементам в каждой строке по их...

user2235010 / 16 мая 2019
0 голосов
0 ответов

Я только начал использовать scala-spark.Я хочу прочитать данные из MongoDB, а также потоковые...

Yoyo / 16 мая 2019
0 голосов
0 ответов

У меня есть стол улья create table json_tab ( c1 string, c2 int, c3 array<struct<c4:string,...

Joha / 16 мая 2019
0 голосов
0 ответов

Я пишу записную книжку на Python, и мне нужно делегировать часть работы в Scala UDF.Я хочу иметь...

user1371314 / 16 мая 2019
0 голосов
1 ответ

В этом запросе мне дан кадр данных со столбцом 5d евклидовых точек (хранится в виде массива двойных...

user132226 / 16 мая 2019
1 голос
1 ответ

У меня есть несколько строковых значений в одном столбце, и я хотел бы заменить подстроки в этом...

Tiffany / 16 мая 2019
0 голосов
2 ответов

Я использую spark-sql для запуска sql, но он показывает только набор результатов, но не показывает...

Tom / 16 мая 2019
0 голосов
0 ответов

Я создал приложение, которое использует Spark-Streaming с пользовательским приемником Google Pub /...

Alex / 15 мая 2019
1 голос
2 ответов

Попытка заменить ноль на 0 в кадре данных, используя UDF ниже. Там, где я могу ошибаться, код...

Pavan_Obj / 15 мая 2019
0 голосов
1 ответ

(Я новичок в Spark, Impala и Kudu.) Я пытаюсь скопировать таблицу из БД Oracle в таблицу Impala,...

radumanolescu / 15 мая 2019
0 голосов
1 ответ
0 голосов
1 ответ

У меня есть файлы паркета, и я хочу прочитать их на основе динамических столбцов, поэтому возьмем...

Vishvanath / 15 мая 2019
1 голос
1 ответ

Я нашел код ниже на этом сайте: https://spark.apache.org/docs/2.3.1/ml-tuning.html // Note that the...

Anneso / 15 мая 2019
0 голосов
0 ответов

У меня есть требование, при котором я должен динамически генерировать несколько столбцов в pyspark....

user11490741 / 15 мая 2019
0 голосов
0 ответов
0 голосов
1 ответ

У меня есть UDF в pyspark, как показано ниже для преобразования строки в метку времени...

syv / 15 мая 2019
0 голосов
2 ответов

Скажем, у меня файл размером 256 КБ хранится в файловой системе HDFS одного узла (как два блока по...

emilly / 15 мая 2019
10 голосов
1 ответ

У меня есть два кадра данных, для которых я пытаюсь найти разницу. 2 кадра данных содержат массивы...

user3407267 / 15 мая 2019
1 голос
0 ответов

Я пытаюсь создать пару в теме для продюсера Кафки. Получение ошибки о том, что Kafka не является...

Thulasitharan / 15 мая 2019
0 голосов
0 ответов

Я хранил данные protobuf в кодировке base64 в таблице больших запросов, где столбцы выглядят...

gunit / 15 мая 2019
0 голосов
1 ответ

Я нахожусь в Jupyter, я выбираю ядро ​​Scala 2.11, когда я помещаю data val = matrix (1, 2, 3, 4,...

petercontrains / 15 мая 2019
0 голосов
0 ответов
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...