График Большие объемы данных в нескольких гистограммах - PullRequest
1 голос
/ 13 апреля 2019

Я хочу построить гистограмму для моих данных, которая выглядит примерно так:

id  date   purchase  visit

id1 date1    $10      0 

id1 date1    $50      0

id1 date2    $30      1

id2 date1    $10      0

id2 date2    $10      1

id2 date3  $10        2  

Обычно каждая строка представляет собой одну транзакцию для клиента в день. Колонка посещений отслеживает предыдущие посещения за день в совокупном виде. Каждый раз при посещении одного и того же клиента в новый день оно увеличивается на 1.

Как я могу создать гистограмму, которая показывает отдельные посещения для каждого клиента. Отдельное посещение определяется как посещение магазина в течение двух дней.

Всего уникальных клиентов = 1215 Всего строк = 1135067

Я попытался запустить следующее:

import random
import numpy
from matplotlib import pyplot

bins = df['visit'].unique() 
uniq_id = df['id'].unique()

pyplot.hist(df['date'], bins, alpha=0.5, label=df['id']) 

pyplot.legend(loc='upper right')
pyplot.show()

Взятая интуиция от построения нескольких гистограмм здесь: Построение двух гистограмм одновременно с помощью matplotlib

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...