Если у меня есть DataFrame следующим образом:
| id | attribute_1 | attribute_2 |
|--------|-------------|-------------|
| 123abc | TRUE | TRUE |
| 123abc | TRUE | FALSE |
| 456def | TRUE | FALSE |
| 789ghi | TRUE | TRUE |
| 789ghi | FALSE | FALSE |
| 789ghi | FALSE | FALSE |
Как применить groupby
или некоторый эквивалентный фильтр для подсчета уникального числа id
элементов в подмножестве DataFrame, которое выглядитнапример:
| id | attribute_1 | attribute_2 |
|--------|-------------|-------------|
| 123abc | TRUE | TRUE |
| 123abc | TRUE | FALSE |
То есть, я хочу получить уникальное количество id
значений, где attribute_1 == True
для всех экземпляров данного id
НО attribute_2
иметь по крайней мере 1 True
.
Таким образом, 456def
не будет включен в фильтр, поскольку в нем нет хотя бы одного True
для attribute_2
.
789ghi
не будет включен в фильтрпотому что все его attribute_1
записи не True
.