Как извлечь Date из имени файла и добавить столбец при чтении Pandas DF на Python? - PullRequest
0 голосов
/ 27 апреля 2018

У меня есть набор файлов в папке, и я хочу зафиксировать дату в имени файла и добавить ее в столбец во время чтения через фрейм данных Pandas.

У меня есть имена файлов вроде X_04_24_2018.txt Y_04_25_2018.txt Z_04_26_2018.txt

Допустим, файл содержит 2 столбца с образцом содержимого. Мне понадобится фрейм данных в следующем формате. Благодарим Вас за помощь.

Col1    Col2    Date        File
XXX     ABC     4/24/2018   X
YYY     BCA     4/25/2018   Y
ZZZ     CBA     4/26/2018   Z

1 Ответ

0 голосов
/ 27 апреля 2018

Одним из способов является использование словарного понимания с os.path для извлечения соответствующих деталей из списка имен файлов.

Затем используйте другое словарное понимание для чтения файлов, используя pd.DataFrame.assign, чтобы назначить соответствующие столбцы.

from os import path
import pandas as pd

files = ['X_04_24_2018.txt', 'Y_04_25_2018.txt', 'Z_04_26_2018.txt']

att = {files[idx]: [i[0][:-11], i[0][-10:].replace('_', '/')]
                   for idx, i in enumerate(map(path.splitext, files))}

dfs = {f: pd.read_csv(f).assign(Date=att[f][1], File=att[f[0]]) for f in files}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...