Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

У меня есть объект rdd (созданный из текстового файла), и я создаю другой объект rdd путем...

sudeep / 14 октября 2019
1 голос
1 ответ

Я новичок в pyspark. Я хочу применить StringIndexer, чтобы изменить значение столбца на индекс. Я...

kevin / 14 октября 2019
0 голосов
0 ответов

Кто-нибудь знает, почему я все-таки получаю эту ошибку в ноутбуках Jupyter ??? Я пытался загрузить...

codemonkey / 14 октября 2019
0 голосов
0 ответов
0 голосов
1 ответ

Я новичок в pyspark. Мне интересно, что означает rdd в фрейме данных pyspark. weatherData = spark

kevin / 13 октября 2019
0 голосов
0 ответов

Я работаю над довольно большим набором данных, который будет обрабатываться в кластере, поэтому я...

b36 / 13 октября 2019
0 голосов
2 ответов

I/p: l=[[1,2,3],[3,4]] O/p: [[1,4,9],[9,16]] Как я могу достичь выше, используя PySpark? Я пытался...

Anil Patil / 13 октября 2019
0 голосов
0 ответов

У меня есть ситуация, когда мне нужно выбрать файл из папки s3 по папке, загрузить схему и...

ADITYA SHARMA / 13 октября 2019
0 голосов
1 ответ

У меня есть некоторый код Python, который просматривает файлы и создает фрейм данных (DF). Кроме...

asher / 13 октября 2019
0 голосов
1 ответ

У меня есть набор данных / рейтингов фильмов, и мне нужно рассчитать среднее значение рейтингов по...

twister9458 / 13 октября 2019
1 голос
0 ответов

У меня есть фрейм данных Pyspark, который выглядит следующим образом >>> df1.show(1,False)...

Bala / 13 октября 2019
0 голосов
0 ответов

У меня есть скрипт, который работал нормально. Скрипт имеет некоторый UDF и в конце сохраняет...

Prashant / 13 октября 2019
1 голос
1 ответ

Я разрабатываю небольшой скрипт в PySpark, который генерирует последовательность дат (за 36 месяцев...

luigi lorenzano / 13 октября 2019
0 голосов
1 ответ

Учитывая RDD в pyspark, я хотел бы создать новый RDD, который содержит (копирует) только свои...

Fanta / 13 октября 2019
0 голосов
1 ответ

Я читаю набор данных набор данных1 и набор данных2 из местоположений S3. Затем я преобразовываю их...

nsc060 / 13 октября 2019
0 голосов
2 ответов

Я хочу получить ближайшие ряды, заданные одной конкретной строкой. Например, дайте два фрейма...

Refrain / 13 октября 2019
1 голос
3 ответов

У меня есть данные, подобные приведенным ниже: It has survived not only five centuries, but also...

RushHour / 13 октября 2019
0 голосов
2 ответов
1 голос
0 ответов

> %pyspark from pyspark.ml.feature import Tokenizer from > pyspark.sql.functions import col,...

sydbristow / 13 октября 2019
0 голосов
0 ответов

Я новичок в pyspark. Я хочу найти номер строки «NA» для каждого столбца. Код ниже имеет проблему. Я...

kevin / 13 октября 2019
0 голосов
0 ответов

Я настроил задание AWS Glue для обработки файлов S3, присутствующих в другой учетной записи AWS B....

pyhotshot / 13 октября 2019
0 голосов
1 ответ

Я пытаюсь создать фрейм данных Spark из фрейма данных Pandas, где я определяю типы данных столбца с...

mjake / 13 октября 2019
0 голосов
1 ответ

У меня есть искровой датафрейм с 20 столбцами. Я хотел бы заменить значения NA в выбранных столбцах...

leena / 13 октября 2019
0 голосов
0 ответов

Что меня удивило после прочтения о RDD в spark pipe, так это то, что мы можем выполнить любой код...

pratik rudra / 12 октября 2019
0 голосов
1 ответ

У меня есть столбец во фрейме данных, в каждой строке которого указан список дат, разделенных...

360p / 12 октября 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...