Как обработать ошибку «Длина значений не соответствует длине индекса», вызванную Pandas Grouper (freq = 'W')? - PullRequest
0 голосов
/ 19 января 2020

Я работаю над набором данных поездки на такси Numenta NY C, размещенным в 'https://raw.githubusercontent.com/numenta/NAB/master/data/realKnownCause/nyc_taxi.csv'. Я хочу сгруппировать данные по неделям, чтобы можно было увидеть изменения на еженедельной основе. Поэтому я сделал следующее:

import matplotlib
import matplotlib.pyplot as plt
from pandas import Grouper
urllib.request.urlretrieve(data_source, data_filename)
taxi_data = pd.read_csv(data_filename, delimiter=',',parse_dates=True, index_col=0, squeeze=True)
groups=taxi_data.groupby(Grouper(freq='W'))

weeks = pd.DataFrame()
for name, group in groups:
    weeks[name.week]=group.values
weeks.plot(subplots=True, figsize=(15,20))

Я получил следующую ошибку из этой строки: weeks[name.week]=group.values

ValueError: Длина значений не соответствует длине индекса

Я полагаю, что ошибка была вызвана различным количеством строк в каждой неделе. Я сделал следующее, чтобы проверить это.

enter image description here

Первая и последняя недели имеют меньше строк, чем остальные. Посоветуйте, пожалуйста, как мне решить проблему.

...