Я хочу построить гистограмму для моих данных, которая выглядит примерно так:
id date purchase visit
id1 date1 $10 0
id1 date1 $50 0
id1 date2 $30 1
id2 date1 $10 0
id2 date2 $10 1
id2 date3 $10 2
Обычно каждая строка представляет собой одну транзакцию для клиента в день.
Колонка посещений отслеживает предыдущие посещения за день в совокупном виде. Каждый раз при посещении одного и того же клиента в новый день оно увеличивается на 1.
Как я могу создать гистограмму, которая показывает отдельные посещения для каждого клиента. Отдельное посещение определяется как посещение магазина в течение двух дней.
Всего уникальных клиентов = 1215
Всего строк = 1135067
Я попытался запустить следующее:
import random
import numpy
from matplotlib import pyplot
bins = df['visit'].unique()
uniq_id = df['id'].unique()
pyplot.hist(df['date'], bins, alpha=0.5, label=df['id'])
pyplot.legend(loc='upper right')
pyplot.show()
Взятая интуиция от построения нескольких гистограмм здесь: Построение двух гистограмм одновременно с помощью matplotlib