Вопросы с тегом apache-искра - PullRequest

Вопросы с тегом apache-искра

1 голос
2 ответов

Новичок в программировании и у него возникли сомнения относительно метода чтения секционированных...

Shubham Pandey / 17 апреля 2019
0 голосов
0 ответов

У меня есть набор данных с 5408 столбцами, все они напечатаны так: _c0 | _c1 | _c2 | _c3 | _c4 |...

Karencia Gárate / 16 апреля 2019
0 голосов
1 ответ

Мне нужно оптимизировать мой код pyspark, чтобы план выполнения был как можно более параллельным; Я...

DPColombotto / 16 апреля 2019
0 голосов
0 ответов

Я пытаюсь настроить поступление данных Кафки в реальном времени в HBase через PySpark в...

thedbogh / 16 апреля 2019
0 голосов
1 ответ

Я хочу отфильтровать СДР, созданный из набора данных на основе длина линии Использование: Pyspark...

Sowmya Kudva / 16 апреля 2019
0 голосов
0 ответов

Я в некотором замешательстве при принятии решения о задаче, которую я выполняю. Это то, что мне...

knowone / 16 апреля 2019
0 голосов
1 ответ

Я работаю с pyspark, и у меня есть несколько дат с типом STRING, например: DATE 2019-03-01 18:04:42...

MaBe Moreira / 15 апреля 2019
2 голосов
1 ответ

Предположим, у вас есть файл, назовем его udfs.py и в нем: def nested_f(x): return x + 1 def...

Ferrard / 15 апреля 2019
1 голос
0 ответов

Я создал таблицу Spark SQL, как показано ниже, с помощью блоков данных Azure: create table...

msmahasm / 15 апреля 2019
0 голосов
0 ответов

У меня есть две базы данных postgres, подключенные к kafka с помощью jdbc-коннектора, поэтому у...

Claudio Melis / 15 апреля 2019
0 голосов
1 ответ

Я хочу запустить Примеры Spark MLlib локально на моем ПК (я думаю, что он называется автономным). Я...

Community Ans / 15 апреля 2019
1 голос
2 ответов

Моя проблема похожа на это и это .В обоих сообщениях показано, как разделить значение столбца на...

Ali / 14 апреля 2019
0 голосов
0 ответов

В настоящее время я разрабатываю прототип для параллельной реализации SGD в PySpark. Все это...

ed2412 / 12 апреля 2019
0 голосов
1 ответ

Мне нужно создать оператор фильтра искры, который фильтрует список столбцов, который динамически...

Francis Drumm / 12 апреля 2019
3 голосов
1 ответ

Я хотел бы захватить результат show в pyspark, аналогично здесь и здесь . Мне не удалось найти...

Kenny / 12 апреля 2019
0 голосов
1 ответ

У меня есть набор данных ниже, и я хочу делать повторения моих строк столько раз и назначить им...

Deepak Sharma / 12 апреля 2019
0 голосов
3 ответов

Мне нужен эффективный способ перечисления и удаления одинарных столбцов в Spark DataFrame (я...

Trademark / 12 апреля 2019
1 голос
0 ответов

Хотите подключить mysql к искре. Это показывает эту ошибку: Traceback (последний вызов был...

Rohan / 12 апреля 2019
0 голосов
1 ответ

Я хочу проверить значение позиции потока Кафки, если равное значение имеет, например, "2", затем...

aigle_5 / 11 апреля 2019
1 голос
0 ответов

Я пытаюсь сгруппировать столбцы и взять минимум.Затем используйте минимальное значение, чтобы...

user1584253 / 11 апреля 2019
0 голосов
0 ответов

Я использую Spark Structured Stream для чтения сообщения от Kafka. Сообщения содержат путь к...

ArmoArmo / 11 апреля 2019
1 голос
1 ответ

Я использую функцию from_json Pyspark SQL, как обычно, например ::100100 >>> import...

frb / 11 апреля 2019
0 голосов
1 ответ

У меня есть один набор данных, и я хочу переставить столбцы (динамическое число столбцов) в две...

Deepak Sharma / 11 апреля 2019
0 голосов
1 ответ

Я получаю данные об использовании пользователя от API администратора отчетов об использовании...

Rodney / 11 апреля 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...