Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

Извинения, если это вопрос новичка, я новичок в PySpark и Python. У меня есть этот RDD, который...

Malik / 27 декабря 2018
0 голосов
0 ответов

Я пытался оценить модель случайного леса, вычисляя значения точности / повторного вызова (PR) и...

lilbludot / 27 декабря 2018
0 голосов
1 ответ

Цель # Распечатать набор данных с названием фильма и числом раз, когда он был оценен. Это простой...

Slimpunkerz / 27 декабря 2018
0 голосов
0 ответов

Итак, я соединяю кафку с искрой и хочу найти это значение в моноблоке.Я не знаю, какой подход...

renton / 26 декабря 2018
0 голосов
2 ответов

У меня 7 классов, а общее количество записей - 115, и я хотел запустить модель Random Forest для...

Surbhi Jain / 26 декабря 2018
0 голосов
1 ответ

В Spark с pyspark у меня есть фрейм данных с дубликатами.Я хочу дедуплицировать их с помощью...

adamcloud / 26 декабря 2018
0 голосов
1 ответ

В чем разница между добавлением и перезаписью к паркету в искре.Я обрабатываю огромное количество...

Sandie / 26 декабря 2018
0 голосов
1 ответ

Я хочу получить все строки из одного DataFrame (df1) так, чтобы его id находилось в пределах + - 10...

user10835311 / 26 декабря 2018
0 голосов
2 ответов

У меня есть данные в следующем формате, которые получены из Hive в фрейм данных: date, stock, price...

Craig / 26 декабря 2018
0 голосов
1 ответ

Я пытаюсь транслировать искровый фрейм данных, пробовал пару подходов, но не смог транслироватьЯ...

Ajay / 26 декабря 2018
0 голосов
1 ответ

У меня есть данные в следующем формате, которые получены из Hive в фрейм данных: date, stock, price...

Craig / 26 декабря 2018
0 голосов
1 ответ

Может ли кто-нибудь объяснить, как я могу отправить мои файлы в мастер всем исполнителям, используя...

Vamsi Nimmala / 25 декабря 2018
0 голосов
0 ответов

В spark 1.6 мы могли использовать конфигурацию spark.ttl.cleaner для очистки метаданных.Как сделать...

Tanaji Sutar / 25 декабря 2018
0 голосов
1 ответ

Ниже приведен пример ввода моих данных.Может быть несколько столбцов, начиная с C, с различными...

dipayan / 25 декабря 2018
0 голосов
2 ответов

Я пытаюсь прочитать pyspark DataFrame из Google Cloud Storage, но постоянно получаю сообщение об...

Yoav / 25 декабря 2018
0 голосов
1 ответ

Я очень новичок в PySpark. Я запускаю сценарий (в основном создаю tfidf и прогнозирую 9...

lU5er / 25 декабря 2018
0 голосов
2 ответов

Я пытаюсь получить данные из Postgresql в моем приложении spark. Но теперь я не совсем понимаю, как...

Hamza Sheikh / 25 декабря 2018
0 голосов
1 ответ

У меня большой массив данных из 3000 переменных.Я хотел бы разделить это на 3 кадра данных по 1000,...

Kruthika Kulkarni / 25 декабря 2018
0 голосов
0 ответов

PySpark 2.4.0 Как обучить модель, которая имеет несколько целевых столбцов? Вот пример набора...

kosi / 25 декабря 2018
0 голосов
0 ответов

Я новичок в искре.Перебирал несколько блогов и проблем, чтобы разобраться в spark и sparkML.Я...

Orian / 25 декабря 2018
0 голосов
2 ответов

У меня есть СДР с датой и временем как tuple, и я хочу подсчитать уникальные имена хостов по дате....

Krishnang K Dalal / 24 декабря 2018
0 голосов
0 ответов

Вот код потоковой передачи, который я запускаю, после запуска в течение двух дней он автоматически...

Udit Mittal / 24 декабря 2018
0 голосов
0 ответов

У меня есть таблица test, зарегистрированная с DataFrame с использованием registerTempTable. И я...

LegoLAs / 24 декабря 2018
0 голосов
1 ответ

Я попытался запустить приложение pyspark. Для этого сначала я установил pyspark из pip, а затем...

Hamza Sheikh / 24 декабря 2018
0 голосов
0 ответов

Я ищу помощь после стольких поисков в Google и до сих пор не могу решить мою проблему. Я пытаюсь...

Ram S / 24 декабря 2018
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...