Выполнение условного оператора для фрейма данных GROUPED в пандах с помощью ноутбука Jupyter - PullRequest
0 голосов
/ 18 июня 2019

Я получаю следующую ошибку:

TypeError: '> =' не поддерживается между экземплярами 'SeriesGroupBy' и 'int'

, когда я выполняю условие для столбца GROUPEDфрейм данных.

       group_school_data["reading_score"] >=70 

У меня нет этой проблемы, когда я использую тот же синтаксис для обычного фрейма данных (не сгруппированного).Поэтому, когда я набираю:

       school_data_complete["reading_score"] >=70

, я получаю отфильтрованный список, который выполнил логическое значение и сделал все экземпляры «счет чтения»> = 70 равным «Истина».Который я могу суммировать.

Однако 'group_school_data' - это сгруппированный фрейм данных, выполняемый для 'school_data_complete' путем группировки фрейма данных по названию школы следующим образом:

     group_school_data = school_data_complete.groupby(["school_name"])
  1. Когда я искал Stackoverflow, я не нашел никаких подсказок.Самый популярный ответ показывает, как создать сгруппированный фрейм данных на основе условия if, а это не то, что я ищу.

  2. Я также наблюдал синтаксис, предложенный в следующемобучающее видео для несгруппированного фрейма данных, но я получаю то же сообщение об ошибке.https://www.youtube.com/watch?v=wJhdZfuO2ZA

Мой код работает для обычного фрейма данных и возвращает серию.

       school_data_complete["reading_score"] >=70

Но не работает для сгруппированного фрейма данных

       group_school_data["reading_score"] >=70 

и возвращает:

TypeError: '> =' не поддерживается между экземплярами 'SeriesGroupBy' и 'int'

'group_school_data' - это сгруппированный фрейм данных, выполняемый для 'school_data_complete' с помощьюсгруппировать фрейм данных по школам следующим образом:

    group_school_data = school_data_complete.groupby(["school_name"])

, и при группировке был возвращен фрейм данных с использованием .head ()

Я ожидаю получить список или серию, когда выполняю то же самое насгруппированный фрейм данных, но я получаю


TypeError Traceback (последний последний вызов) в ----> 1 group_school_data ["math_score"]> = 70

TypeError: '> =не поддерживается между экземплярами 'SeriesGroupBy' и 'int'

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...