построить данные строки по индексу в Python - PullRequest
0 голосов
/ 13 декабря 2018

У меня есть набор данных в следующем формате:

             query_phone         Day   Actor      ObjGrp
0              495393475  2017-09-21   Joana      din
1              676793475  2017-09-21   marta      ver
2              806494953  2017-09-21   joao       hav
3              595243631  2017-09-21   mark       din
4              444709531  2017-09-25   caty       ver
5              447159403  2017-09-25   rodin      tug
6              762976443  2017-09-25   rodin      tug
7              865853581  2017-09-25   john       han
8              441331962  2017-09-25   van        ver
9              261331962  2017-09-25   van        ver
10             455924196  2017-09-25   david      wog

Могу ли я иметь, фрейм данных имеет 80000 строк.

Я хочу построить распределение.Под этим я подразумеваю построение линии, которая для каждого комбинированного телефона, дня, актера и объекта objgrp сообщает мне, сколько раз этот экземпляр появляется, и таким образом я могу рассказать о поведении покоя.

Кто-нибудь знает, как?все способы построения, которые я нахожу, не только не принимают строковый тип, но и не позволяют мне выбирать ось Y как количество.

Спасибо,

1 Ответ

0 голосов
/ 13 декабря 2018

В этой публикации есть обсуждение, где @DSM показывает, как объединить записи с одинаковым значением в данном столбце, как предложил автор оригинальной публикации:

pd.concat(g for _, g in df.groupby("ID") if len(g) > 1)

ЭтоПредполагается, что вы открыли свои данные в качестве кадра данных панды.

Если вы посмотрите на функцию группировки Документация , вы сможете заметить, что вы можете сгруппировать их по нескольким столбцам, которые, если я правильно понял ваш вопрос, вернутсядля вас список, где вы можете легко увидеть повторы и изучить их частоту.

...