У меня есть следующий фрейм данных:
foo bar
0 Alice 42
1 Alice 44
2 Bob 22
и я пытаюсь получить новый фрейм данных, исключая последнюю строку, потому что Bob
встречается только один раз в столбце foo
foo bar
0 Alice 42
1 Alice 44
Вот код, который я использую для создания фрейма данных, показанного выше:
df = pd.DataFrame(
{
"foo": ["Alice", "Alice", "Bob"],
"bar": [42, 44, 22]
}
)
и мой подход к этому требованию (который не работает ..)
col_foo_gt_1 = df["foo"].value_counts() > 1
print(col_foo_gt_1["Alice"]) # Prints true
print(col_foo_gt_1["Bob"]) # Prints false
df_bob_removed = pd.DataFrame(
df[col_foo_gt_1[df["foo"]]]
)
Я получаю ошибку:
ValueError: cannot reindex from a duplicate axis