Итак, у меня есть Pandas DataFrame
. Я делаю data analysis
с Python
с некоторыми наборами компаний на основе продуктов, которые они предлагают на моем сайте.
Например, у меня есть столбец с именем ProductID
, а другой - с именем Company
Таким образом, чтобы найти самые популярные товары на моем веб-сайте, я могу сделать это следующим образом:
df.ProductID.value_counts(normalize=True).nlargest(10).plot(kind="bar") #top 10 popular products
И каждый продукт предлагается компанией, и у компании может быть несколько продуктов, то есть компания может иметь несколько ProductID
. ie CompanyA
имеет ProductID 10,12,13,14
Как мне определить рыночную позицию компании? Имея в виду, что продукт компании может появляться в 3 или более раз в зависимости от популярности компании.