Я использовал пакет empiricaldist для создания графика CDF
для фрейма данных.
data1.head()
+---+---------+----------+----------+-------+--------------+------------+
| | trip_id | distance | duration | speed | acceleration | travelmode |
+---+---------+----------+----------+-------+--------------+------------+
| 0 | 303637 | 5.92 | 0.51 | 3.20 | 0.00173 | bike |
| 1 | 303638 | 3.54 | 0.22 | 4.44 | 0.00557 | metro |
| 2 | 303642 | 4.96 | 0.20 | 6.84 | 0.00944 | bus |
| 3 | 303662 | 6.53 | 0.97 | 1.86 | 0.00053 | foot |
| 4 | 303663 | 40.23 | 0.94 | 11.85 | 0.00349 | car |
+---+---------+----------+----------+-------+--------------+------------+
data1.shape
(4125, 6)
Ниже CDF
для скорости движения для каждого вида транспорта в travelmode
:
from empiricaldist import Cdf
for name, group in data1.groupby('travelmode'):
Cdf.from_seq(group.speed).plot()
def decorate_cdf(title, xlabel, ylabel):
"""Labels the axes.
title: string
"""
plt.xlabel(xlabel)
plt.ylabel(ylabel)
plt.title(title)
x = 'speed (km/h)'
y = 'CDF'
title = 'Speed by mode'
decorate_cdf(title,x, y)
рисунок:
Вопрос: Как добавить legend
к cdf
, чтобы указатькакой участок для какого режима путешествия?