Как найти позицию атрибута с учетом других атрибутов в Pandas DataFrame с Python - PullRequest
0 голосов
/ 31 марта 2020

Итак, у меня есть Pandas DataFrame. Я делаю data analysis с Python с некоторыми наборами компаний на основе продуктов, которые они предлагают на моем сайте.

Например, у меня есть столбец с именем ProductID, а другой - с именем Company

Таким образом, чтобы найти самые популярные товары на моем веб-сайте, я могу сделать это следующим образом:

df.ProductID.value_counts(normalize=True).nlargest(10).plot(kind="bar") #top 10 popular products

И каждый продукт предлагается компанией, и у компании может быть несколько продуктов, то есть компания может иметь несколько ProductID. ie CompanyA имеет ProductID 10,12,13,14

Как мне определить рыночную позицию компании? Имея в виду, что продукт компании может появляться в 3 или более раз в зависимости от популярности компании.

...