Я сейчас работаю над набором данных и хочу найти долю населения (туриста), посетившего место (музей), более 75% всех туристов. Я могу найти лучшие 25%, но это не помогает мне решить эту проблему. Кто-нибудь может дать мне несколько советов, чтобы решить эту проблему? Даже некоторые предложения, как я мог бы решить это, были бы очень полезны. К сожалению, я не смог найти ничего в Google.
Я уже сгруппировал людей в следующие столбцы:
card_id
, hour
, adult_activation
, adult_not_activation
, minor
, admission
, а также суммировали идентификаторы карт, поскольку некоторые люди посетили несколько музеев.
Любой код, который я уже написал, не поможет, поэтому я не прикрепил его.