Чтение набора данных и создание нескольких участков рассеяния - PullRequest
0 голосов
/ 17 ноября 2018

У меня есть следующие данные (имя набора данных - «данные» в приведенном ниже коде) и код.Пока мой код строит одну диаграмму рассеяния за раз;Мне нужно изменить название компании вручную, если я хочу получить конкретный график рассеяния для конкретной компании.Я надеюсь, что смогу просмотреть приведенный ниже набор данных одним махом, так что мой предполагаемый код читает название компании и выполняет манипуляции, собранные в существующем коде ниже, и в конечном итоге создает отдельные диаграммы рассеяния (т. Е. Вспомогательные участки) для обеих компаний Company1 и Company2 безодин график рассеяния перезаписывает или накладывает на другой.Я думал, что мог бы использовать цикл for, чтобы пройти строки кода, которые у меня есть ниже, но мне не хватает чего-то.Может ли кто-нибудь, пожалуйста, дать некоторое представление?

Заранее спасибо.

Набор данных:

Date       Company  Cum_FootTraffic 
1/1/2015   Company1     450
1/3/2015   Company1     464
1/4/2015   Company1     481
1/5/2015   Company1     500
1/8/2015   Company1     508
………………………………………………………………
6/30/2015  Company1     810
4/2/2015   Company2     203
4/3/2015   Company2     208
4/4/2015   Company2     211
4/5/2015   Company2     218
4/8/2015   Company2     223
4/10/2015  Company2     234 
…………………………………………………………………
8/10/2015  Company2     498

Код:

data2=data.loc[data['username']=='Company1']

data2['Cum_FootTraffic_lag']=data2['Cum_FootTraffic'].shift(1)
data2['count']=data2['Cum_FootTraffic']-data2['Cum_FootTraffic_lag']
data2=data2.loc[data2['count']>=0]
data2=data2[['username','Date','Cum_FootTraffic','Cum_FootTraffic_lag','count']]

#Plotting data and manipulating plot size
#Scatterplot

dates = matplotlib.dates.date2num(data2['Date'])
matplotlib.pyplot.scatter(dates, data2['count'])
matplotlib.pyplot.show()
...