Вопросы с тегом pyspark - PullRequest

Вопросы с тегом pyspark

0 голосов
1 ответ

Я заинтересован в округлении временных меток до полных часов.Что я получил, так это округлился до...

EchoCache / 09 июня 2019
2 голосов
3 ответов

Я хочу изменить этот код, чтобы использовать цикл for: df = spark.createDataFrame([(0...

au.tumn / 09 июня 2019
1 голос
0 ответов

У меня есть DataFrame с идентификаторами документов doc_id, идентификаторами строк для набора строк...

Clay / 08 июня 2019
0 голосов
1 ответ

У меня есть фрейм данных df, который содержит список строк примерно так: +-------------+ Products...

thentangler / 08 июня 2019
0 голосов
0 ответов

Я скачал правдивый дамп Wikidata в формате RDF (файл .nt.bz2). Я хочу ограничить язык дампа только...

Aman / 08 июня 2019
0 голосов
0 ответов

У меня есть код ниже в R, и я пытаюсь преобразовать его в эквивалентный код pyspark, но после...

Tilo / 08 июня 2019
1 голос
1 ответ

У меня есть таблица кустов: department ip A 10.192.168.2 B 172.16.0.1 A 10.192.168.23 B 172.16.0.24...

vishwajeet / 08 июня 2019
0 голосов
0 ответов

Я использую Spark 2.4.2 на GCP DataProc и применяю агрегирование с сохранением состояния для...

user1411837 / 08 июня 2019
0 голосов
1 ответ

Предположим, я выполняю простой скрипт pyspark data_rdd.map(some_fun).toDF(), где data_rdd содержит...

Tony / 08 июня 2019
0 голосов
0 ответов

У меня есть задание ETL, в котором я загружаю некоторые данные из S3 в динамический фрейм,...

Zach / 07 июня 2019
0 голосов
0 ответов

Я пытался написать юнит-тесты с pyspark. Тесты проходят со следующей конфигурацией, когда...

hrzafer / 07 июня 2019
1 голос
1 ответ

Я запрашиваю таблицы, но у меня разные результаты, используя два способа, я хотел бы понять причину

Eric Gabriel Bellet Locker / 07 июня 2019
0 голосов
1 ответ

Я пытаюсь сохранить набор данных, используя partitionBy на S3, используя pyspark.Я делю на столбец...

Umar / 07 июня 2019
0 голосов
1 ответ

У меня есть датафрейм с двумя столбцами, представляющими собой список ребер, и я хочу создать из...

Tilo / 07 июня 2019
2 голосов
3 ответов

Мой фрейм данных - это, и я хочу разделить мой фрейм данных двоеточием (:) +------------------+...

Cool Triks / 07 июня 2019
0 голосов
1 ответ

У меня есть база данных json, загруженная с помощью pyspark. Я пытаюсь получить доступ ко всем "х"...

Spoutnovitch / 07 июня 2019
0 голосов
0 ответов

Я пытаюсь найти нечеткое совпадение между двумя наборами названий организаций.Один набор будет...

Neel / 07 июня 2019
0 голосов
1 ответ

мой фрейм данных pyspark - "Значения": +------+ |w_vote| +------+ | 0.1| | 0.2| | 0.25| | 0.3| | 0

Tilo / 07 июня 2019
0 голосов
2 ответов

У меня есть этот Dataframe: я хочу заменить 1 на df.rule1 и 2 на df.rule2 +---+---------+------+...

C_codio / 07 июня 2019
0 голосов
1 ответ

Предположим, у меня есть DataFrame столбца списка StructType с именем 'arr', который можно описать...

Tony / 07 июня 2019
0 голосов
1 ответ

Я пытаюсь заполнить пропущенные значения в столбце. Столбец профиля в 1-й строке или в любой из...

user422930 / 07 июня 2019
0 голосов
0 ответов

У меня много фреймов данных pyspark, два фрейма данных pyspark, к которым я хотел бы присоединиться...

Mike / 07 июня 2019
0 голосов
0 ответов

Я хотел бы использовать python-igraph для построения GraphFrame, на котором я только что запустил...

Michele La Ferla / 06 июня 2019
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...