У меня есть датафрейм с именем, днем и местоположением. Для каждой тройки имени-местоположения-местоположения я хочу знать, какая доля строк с этим именем-днем имеет это местоположение.
В коде я начинаю с df
и ищу expected
.
import pandas as pd
df = pd.DataFrame(
[
{"name": "Alice", "day": "friday", "location": "left"},
{"name": "Alice", "day": "friday", "location": "right"},
{"name": "Bob", "day": "monday", "location": "left"},
]
)
print(df)
expected = pd.DataFrame(
[
{"name": "Alice", "day": "friday", "location": "left", "row_percent": 50.0},
{"name": "Alice", "day": "friday", "location": "right", "row_percent": 50.0},
{"name": "Bob", "day": "monday", "location": "left", "row_percent": 100.0},
]
).set_index(['name', 'day', ])
print(expected)
Отпечатано:
In [13]: df
Out[13]:
day location name
0 friday left Alice
1 friday right Alice
2 monday left Bob
In [12]: expected
Out[12]:
location row_percent
name day
Alice friday left 50.0
friday right 50.0
Bob monday left 100.0