Использование функции группового панд, как запросить подмножество данных и поместить его в список - PullRequest
0 голосов
/ 27 ноября 2018

Используя python 3.7 и panadas, как правильно запрашивать все учетные записи, относящиеся к 'building x'?

Данные Excel

Building    Account Sales rep
23          1234567       Bob
24          7654231     Steve
25           12ae23       Bob
23           A11111      Jeff
26           A22222      Jeff
26           A33333       Bob
            A444448      Mike

Вот мой код, который я пытаюсь

Import pandas as pd
table_data  = pd.read_excel(‘excel.xlsx', sheet_name='Sheet1', dtype=str)
buildings = table_data[‘Building’].tolist()
accounts = table-data[‘Account’].tolist()

grouped_by_building = table_data.groupby("Building")[["Building", "Account", "Sales rep"]]
for item, group in grouped_by_building:
    print(item, group)

Я хочу запросить и получить результаты, скажем, всех учетных записей, принадлежащих зданию26.

OUTPUT

Building_26_list = [‘A22222’, ‘A33333’]
Building_23_list = [‘1234567’, ‘A11111’]

У меня проблемы с выяснением того, как запросить только здания для итерации.

1 Ответ

0 голосов
/ 27 ноября 2018

Вам просто нужно получить доступ к свойству groups объекта GroupBy.Это делается следующим образом:

grouped_by_building = table_data.groupby("Building").groups
for item, group in grouped_by_building.items():
    print(item, group)

Обратите внимание, что вы используете функцию .items (), чтобы получить словарь {item: [..., ...]} как список кортежей [(item,[..., ...]), ...]

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...