Группировка и подсчет частоты не возвращают правильное значение - PullRequest
1 голос
/ 14 июля 2020

Я использую этот код для группировки компаний и для подсчета частоты. Однако возвращенный результат не сгруппировал компании

freq = df.groupby(['company'])['recruitment'].size()


I got some result similar to this. 
             recruitment
company      
  Data Co       3
  Data Co       8
  Apple Co      3
  Apple Co      6

У меня два вопроса:

  1. почему эта groupby не сгруппировала те же компании?
  2. Когда я поставить freq.columns. Показана только колонка набора, компания исчезла. Есть ли способ показать две колонки: компания и набор персонала?

1 Ответ

0 голосов
/ 14 июля 2020

Если название компании выглядит «одинаково», значит, у вас есть пробелы в начале или в конце, я также добавляю верхний преобразователь в верхний регистр.

freq = df.groupby(df['company'].str.strip().str.upper())['recruitment'].size()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...