Ошибка при добавлении нового столбца в pandas dataframe - PullRequest
0 голосов
/ 02 июня 2018

Я пытаюсь изменить файлы .csv в папке.Файлы содержат информацию о рейсах за 2011-2016 годы.

Однако в значениях нельзя найти информацию о году.

Я хотел бы решить эту проблему, используя имя файла .csv, который содержит год.Я добавляю новый столбец 'year' после считывания его в фрейм данных pandas.Затем я экспортирую измененный файл в новый файл .csv, имя файла которого будет указывать только год.

Однако я сталкиваюсь с этой ошибкой:

ValueError: Длина значений несоответствует длине индекса

Код ниже для вашей справки.

import pandas as pd
import glob
import re
import os

path = r'data_caap/'                   
all_files = glob.glob(os.path.join(path, "*.csv"))


for f in all_files:
    df = pd.read_csv(f)
    year= re.findall(r'\d{4}', f)

    #Error here
    df['year']=year
    #Error here

    df.to_csv(year)

1 Ответ

0 голосов
/ 02 июня 2018

Найдена причина ошибки.

Должно быть df ['year'] = year [0].findall возвращает список.- DyZ

Большое спасибо @ Dyz

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...