Войти

Запомнить

Регистрация

Лента
Топ
Теги
Новая

Hemesh Patel 25 апреля 2019 4

Pandas Groupby против Pyspark Groupby не то же самое

0 голосов

Hemesh Patel / 25 апреля 2019

У меня есть датафрейм для панд, и я уже выполнил групповую работу. Сейчас я меняю процесс и использую pyspark.

Groupby в пандах и pyspark отличается (количество строк).

Кто-нибудь испытывал это?

питон
набор данных
панды-GroupBy
pyspark-SQL

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.

Похожие темы

NameError: имя 'split' не определено с помощью Spark
Ошибка при запуске файла python: количество столбцов не совпадает. \ NСтарые имена столбцов (1): _c0 \ nНовые имена столбцов (4)
Pyspark: получить количество различных комбинаций между двумя столбцами.
Исключение SparkSQL
Pyspark: получить наиболее распространенное значение столбца?
Как создать таблицу с идентификатором GUID / Autogenerate в DataBricks
collect () против select (). принять значение искрового кадра данных
Разумно использовать сопоставление из столбцов для заполнения значения в другом столбце в фрейме данных pyspark
записывать данные в файл dat в pyspark, используя фрейм данных
Прочитать текстовый файл и преобразовать HTML в простой текст определенного столбца в pyspark

...