Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

Я пытаюсь создать кластеризацию k-средних в pyspark.Я использую mnist в качестве набора данных, в...

Abhishek / 04 марта 2019
0 голосов
1 ответ

Я использую записную книжку Azure DataBricks с библиотекой Azure, чтобы получить список файлов в...

smeidak / 04 марта 2019
0 голосов
1 ответ

Я отправляю искровое приложение на YARN со следующими конфигами conf.set("spark.executor

Vaibhav Bacchav / 04 марта 2019
0 голосов
0 ответов

Я читаю некоторые данные (8 ГБ) из нескольких файлов, фильтрую данные, выполняя некоторую нулевую...

Bilal Shafqat / 04 марта 2019
0 голосов
1 ответ

База данных в Oracle с типом столбца NUMBER при извлечении с использованием pyspark преобразуется в...

Amita Rawat / 04 марта 2019
0 голосов
1 ответ
0 голосов
0 ответов

Я пытаюсь прочитать файлы паркетных разделов S3 (fake - localstack), используя Pyspark (2.4) с...

agonen / 04 марта 2019
0 голосов
0 ответов

spark = SparkSession.builder \ .master("spark://ip:7077") \ .appName("usres mobile...

Taimur Islam / 04 марта 2019
0 голосов
0 ответов

Я пытаюсь транслировать твиты, используя pyspark и библиотеку tweepy, чтобы получить десятку лучших...

Deemah Alomair / 04 марта 2019
0 голосов
0 ответов

Я пытаюсь запустить обе искровые консоли (scala и pyspark).Оба прекрасно работают в Windows CMD, но...

CoffeeIsProgramming / 04 марта 2019
0 голосов
1 ответ

Я использую python с потоковой передачей искры, и идея проста: сделать монитор потоковой передачи...

Michael / 03 марта 2019
0 голосов
1 ответ

Необходимо включить ведение журнала INFO для получения подробной информации, но можно...

Sourav Ghosh / 03 марта 2019
0 голосов
0 ответов

Я использую PySpark 2 и пытаюсь получить доступ к данным из Vertica, аутентифицированным Kerberos....

Vikas Raturi / 03 марта 2019
0 голосов
1 ответ

Я использую PySpark и не устанавливал Hadoop как таковой.Я получаю это предупреждение Hadoop...

Miguel A. Friginal / 03 марта 2019
0 голосов
1 ответ

Здесь установлены ядра: $jupyter-kernelspec list Available kernels: apache_toree_scala...

javadba / 03 марта 2019
0 голосов
1 ответ

У меня есть 2 фрейма данных pyspark, после некоторых манипуляций, состоящих из 1 столбца каждый, но...

Val A / 03 марта 2019
0 голосов
0 ответов

У меня есть функция runTests (sc) в файле test_spark.py Я открываю интерпретатор python в каталоге,...

StrawhatLuffy / 03 марта 2019
0 голосов
1 ответ

У меня есть матрица размером 1000 * 10000.Я хочу преобразовать эту матрицу в фрейм данных pyspark....

arijit / 02 марта 2019
0 голосов
1 ответ

Я пытаюсь настроить искровой кластер в DigitalOcean и создал там главный и два подчиненных узла;Мне...

Pankaj Sharma / 02 марта 2019
0 голосов
2 ответов

У меня есть фрейм данных, который я хочу разделить на год, месяц и день на основе существующего...

Krishna Mitra / 02 марта 2019
0 голосов
1 ответ

Я работаю над SVD, используя pyspark.Но в документации , как и в любом другом месте, я не нашел,...

arijit / 02 марта 2019
0 голосов
0 ответов

Я пытаюсь прочитать индексasticsearch с помощью Pyspark (v1.6.3), но получаю следующую ошибку Я...

Vaibhav Bacchav / 02 марта 2019
0 голосов
2 ответов

У меня есть фрейм данных pyspark, в котором есть один столбец с векторными значениями и один...

Ashima Horra / 02 марта 2019
0 голосов
1 ответ

У меня есть фрейм данных Spark, который имеет 1 строку и 3 столбца, а именно start_date, end_date,...

user1552698 / 02 марта 2019
0 голосов
2 ответов

Я пытаюсь получить разницу между двумя столбцами отметок времени, но миллисекунды пропали. Как...

Keerikkattu Chellappan / 01 марта 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...