У меня есть фрейм данных, который выглядит примерно так:
ID Date Name ColA ColB ColC ColD Column_Interest
1 09/12 Ann String String String String OneThing
2 09/13 Pete String String String String OneThing
2 09/13 Pete String String String String AnotherThing
3 09/13 Ann String String String String OneThing
3 09/13 Ann String String String String AnotherThing
3 09/13 Ann String String String String ThirdThing
4 09/12 Pete String String String String OneThing
Что я хочу сделать:
- Создание описательной статистики по идентификатору. Так, например, я хотел бы знать все варианты «Column_Interest» для «ID» = 3. Я вижу, что они выбрали несколько опций, когда я просматриваю фрейм данных, но я не могу понять, как мне сгруппировать эти данные для анализа.
- Смотрите наиболее часто встречающиеся комбинации. Например, для тех идентификаторов, которые имеют более одной строки, какие комбинации наиболее часто встречаются в Column_Interest? Должен отметить, что меня не интересует порядок выбора.