Анализ нескольких записей на один ID с использованием Python - PullRequest
0 голосов
/ 03 мая 2018

У меня есть фрейм данных, который выглядит примерно так:

ID   Date  Name    ColA    ColB    ColC    ColD     Column_Interest
 1  09/12   Ann  String  String  String  String            OneThing
 2  09/13  Pete  String  String  String  String            OneThing
 2  09/13  Pete  String  String  String  String        AnotherThing
 3  09/13   Ann  String  String  String  String            OneThing
 3  09/13   Ann  String  String  String  String        AnotherThing
 3  09/13   Ann  String  String  String  String          ThirdThing
 4  09/12  Pete  String  String  String  String            OneThing

Что я хочу сделать:

  1. Создание описательной статистики по идентификатору. Так, например, я хотел бы знать все варианты «Column_Interest» для «ID» = 3. Я вижу, что они выбрали несколько опций, когда я просматриваю фрейм данных, но я не могу понять, как мне сгруппировать эти данные для анализа.
  2. Смотрите наиболее часто встречающиеся комбинации. Например, для тех идентификаторов, которые имеют более одной строки, какие комбинации наиболее часто встречаются в Column_Interest? Должен отметить, что меня не интересует порядок выбора.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...