У меня есть набор данных, который содержит несколько уникальных идентификаторов, и я хотел бы получить подсчет значений того, сколько из этих идентификаторов содержат и «оригинал», и «копию» в столбце содержимого.Кроме того, как мне сделать это в нескольких столбцах?
Я знаю, как сделать это в Excel, но довольно плохо знаком с Python, поэтому любая помощь будет очень полезной!
df:
user_id content_type status
1234 original pending
1234 copy blocked
4321 original blocked
4321 original distributed
5678 original blocked
5678 copy pending
Вывод:
оригинал + копия = 2
оригинал + в ожидании = 1
оригинал + заблокирован = 2
и т. Д.