Я пытаюсь изменить файлы .csv в папке.Файлы содержат информацию о рейсах за 2011-2016 годы.
Однако в значениях нельзя найти информацию о году.
Я хотел бы решить эту проблему, используя имя файла .csv, который содержит год.Я добавляю новый столбец 'year' после считывания его в фрейм данных pandas.Затем я экспортирую измененный файл в новый файл .csv, имя файла которого будет указывать только год.
Однако я сталкиваюсь с этой ошибкой:
ValueError: Длина значений несоответствует длине индекса
Код ниже для вашей справки.
import pandas as pd
import glob
import re
import os
path = r'data_caap/'
all_files = glob.glob(os.path.join(path, "*.csv"))
for f in all_files:
df = pd.read_csv(f)
year= re.findall(r'\d{4}', f)
#Error here
df['year']=year
#Error here
df.to_csv(year)