Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
2 ответов
0 голосов
0 ответов

На каком основании мы должны принять решение о количестве разделов при повторном разбиении фрейма...

0 голосов
1 ответ

Я создаю новый столбец и превращаю его в целоеНо столбец не обнуляется.Как я могу сделать новый...

F4RZ4D / 17 мая 2019
0 голосов
0 ответов

У меня есть Spark DataFrame с одним столбцом «компонент», который состоит из строковых массивов и...

Jawahir Ak / 17 мая 2019
0 голосов
1 ответ

Создайте новую таблицу из двух существующих таблиц A и B, A имеет данные истории за 1 год, а B...

kalis / 17 мая 2019
0 голосов
0 ответов

У меня возникли проблемы с пониманием создания пользовательских преобразователей для конвейеров...

Windstorm1981 / 17 мая 2019
0 голосов
1 ответ

Я пытаюсь отфильтровать данные в фрейме данных, который существует в другом списке кортежей....

Liat / 16 мая 2019
0 голосов
0 ответов

Я пытаюсь соединить kafka с python (блокнотом jupyter) после добавления jar-файла, мой код не...

Akash Singh / 16 мая 2019
1 голос
1 ответ

У меня есть кадр данных, который выглядит как key | value | time | status x | 10 | 0 | running x |...

marisbest2 / 16 мая 2019
0 голосов
1 ответ

Я пытаюсь передать и преобразовать несколько фреймов данных из Scala в Pyspark. когда я пробую его...

andrew / 16 мая 2019
2 голосов
1 ответ

В SQL есть: REFRESH TABLE table_name и в pyspark эквивалент: spark.refreshTable(table_name) Итак,...

Henrique Florêncio / 16 мая 2019
0 голосов
0 ответов

У меня есть кластер ES, из которого я хотел бы извлечь все идентификаторы сеанса (настраиваемое...

user976850 / 16 мая 2019
0 голосов
0 ответов

У меня есть фрейм данных Pyspark с 1,6 миллионами записей.Я отсортировал его, а затем сгруппировал,...

sammanic / 16 мая 2019
0 голосов
1 ответ

показывает .count (), но неправильно .sum (), что мне делать? код: def meanTemperature(df,spark):...

David Echo / 16 мая 2019
0 голосов
0 ответов

Я хочу реализовать эту модель в моей среде, поэтому не могли бы вы, пожалуйста, кто-нибудь сказать...

Suresh / 16 мая 2019
0 голосов
2 ответов

Я работаю с таким фреймом данных: DeviceNumber | CreationDate | Name 1001 | 1.1.2018 | Testdevice...

Thomas Hahn / 16 мая 2019
0 голосов
0 ответов

Я выполняю потоковую передачу файлов из каталога, находящегося в состоянии копирования, и я хочу,...

RedHead_121 / 16 мая 2019
1 голос
2 ответов

Я хочу повысить производительность своего приложения с помощью pyspark. Фрейм данных выглядит...

hhw h / 16 мая 2019
0 голосов
1 ответ

import numpy as np import pandas as pd import sparkobj as spk from sklearn.datasets import...

chapter3 / 16 мая 2019
0 голосов
1 ответ

Я запускаю сценарии pyspark в блокноте jupyter, но ядро ​​не запускается. после выбора pyspark из...

Alankar Gupta / 16 мая 2019
0 голосов
0 ответов

Я пишу записную книжку на Python, и мне нужно делегировать часть работы в Scala UDF.Я хочу иметь...

user1371314 / 16 мая 2019
0 голосов
1 ответ

Мне нужно собрать значения столбцов и сохранить их в виде массива из фрейма данных spark. Так же,...

Mitali Soyantar / 16 мая 2019
1 голос
1 ответ

В моем фрейме данных есть столбец возраста.Общее количество строк составляет около 77 миллиардов.Я...

Nikita Agarwal / 16 мая 2019
0 голосов
1 ответ
0 голосов
0 ответов

Я успешно создал векторы меток и объектов и могу применить к ним анализ pca, но в результате...

Ashutosh Mishra / 15 мая 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...