Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня проблемы с памятью, но я не могу ее решить.Любая помощь высоко ценится.Я новичок в...

Jenny / 22 мая 2018
0 голосов
3 ответов

В соответствии с таким количеством хороших ресурсов, желательно переразбить RDD после работы...

Mayank Mittal / 22 мая 2018
0 голосов
1 ответ

У меня есть подходящая модель PCA в PySpark, и мне нужно получить количество компонентов из объекта...

Clock Slave / 22 мая 2018
0 голосов
0 ответов

Я пытался запустить hql-файлы, как показано ниже, но получаю сообщение об ошибке...

hival / 22 мая 2018
0 голосов
0 ответов

Мне нужно вычислить несколько агрегатов для каждой таблицы в базе данных Hive.Мой код выглядит...

sergionsk8 / 22 мая 2018
0 голосов
1 ответ

У меня есть pyspark для загрузки данных из файла TSV и сохранения его в виде файла паркета, а также...

Mikhail Venkov / 22 мая 2018
0 голосов
1 ответ

Мне нужно отправить файл py с API Apache Spark Hidden REST. Как я следовал учебнику arturmkrtchyan ...

Mahsa Pourjafarian / 22 мая 2018
0 голосов
1 ответ

Я смотрю, как перераспределить (в PySpark) набор данных, чтобы все строки с одинаковым...

mechov / 22 мая 2018
0 голосов
1 ответ

Справочная информация: я делаю простую двоичную классификацию, используя RandomForestClassifier из...

Yiming Wu / 22 мая 2018
0 голосов
1 ответ

Исходными данными являются журналы событий с устройства, и все данные имеют формат json, образец...

Linxiang Liu / 22 мая 2018
0 голосов
0 ответов

Я читаю данные из источника jdbc и записываю их непосредственно в индекс эластичного поиска.Когда я...

MOHIT PATNI / 22 мая 2018
0 голосов
0 ответов

У меня есть CSV-файл, который имеет следующий макет: Website Text A B В первом столбце находится...

Bashir / 22 мая 2018
0 голосов
0 ответов

Я сталкиваюсь с этой ошибкой при запуске задания спарка в автономном режиме кластера. У меня есть...

prim / 22 мая 2018
0 голосов
0 ответов

Не удалось заставить его выполнить преобразование data['date']= pd

Ajaxcbcb / 22 мая 2018
0 голосов
1 ответ

В pyspark sqlcontext sql, напишите код, чтобы получить текст, а затем переформатируйте его. Но...

Sarath Chandra / 22 мая 2018
0 голосов
1 ответ

У меня есть функция с именем "inside".Я хочу применить эту функцию к фрейму данных pyspark.Для...

KingMaker / 22 мая 2018
0 голосов
1 ответ

У меня есть приложение, которое создает несколько фреймов данных, записывает их на диск, а затем...

BossColo / 22 мая 2018
0 голосов
2 ответов

У меня есть требование для вычисления различных значений для большого количества столбцов (> 20...

breakingduck / 22 мая 2018
0 голосов
2 ответов

У меня есть два кадра данных.Мне нужно найти значение в кадре данных и обновить ячейку для...

Sham / 21 мая 2018
0 голосов
1 ответ

У меня есть искровой фрейм данных с 2 столбцами, которые представляют даты (date1 и date2).Я хотел...

Eyal S. / 21 мая 2018
0 голосов
1 ответ

У меня есть скрипт, который генерирует DataFrame.Я преобразовываю DF в CSV, а затем отправляю его...

Ashley O / 21 мая 2018
0 голосов
1 ответ

Запуск автономного spark-2.3.0-bin-hadoop2.7 внутри док-контейнера df1 = 5 строк df2 = 10 строк...

Ajaykishan / 21 мая 2018
0 голосов
1 ответ

Я новичок в Pyspark и пытаюсь выяснить, как хранить данные в датафрейме.У меня есть таблица размера...

Maria / 21 мая 2018
0 голосов
1 ответ

Я использую кластер Spark в конфигурации 1 MasterNode, 3 WorkerNode с использованием aws emr и...

simplycoding / 21 мая 2018
0 голосов
0 ответов

Как отладить функцию карты pyspark в редакторе pycharm.Я выбрал python env varables: Заранее...

Robert / 21 мая 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...