Я работаю над набором данных поездки на такси Numenta NY C, размещенным в 'https://raw.githubusercontent.com/numenta/NAB/master/data/realKnownCause/nyc_taxi.csv'. Я хочу сгруппировать данные по неделям, чтобы можно было увидеть изменения на еженедельной основе. Поэтому я сделал следующее:
import matplotlib
import matplotlib.pyplot as plt
from pandas import Grouper
urllib.request.urlretrieve(data_source, data_filename)
taxi_data = pd.read_csv(data_filename, delimiter=',',parse_dates=True, index_col=0, squeeze=True)
groups=taxi_data.groupby(Grouper(freq='W'))
weeks = pd.DataFrame()
for name, group in groups:
weeks[name.week]=group.values
weeks.plot(subplots=True, figsize=(15,20))
Я получил следующую ошибку из этой строки: weeks[name.week]=group.values
ValueError: Длина значений не соответствует длине индекса
Я полагаю, что ошибка была вызвана различным количеством строк в каждой неделе. Я сделал следующее, чтобы проверить это.
Первая и последняя недели имеют меньше строк, чем остальные. Посоветуйте, пожалуйста, как мне решить проблему.