У меня есть большая сумма .txt файлов, которые я хочу объединить вместе, но в самих файлах отсутствуют даты.
Однако, дата - это имя файла , которое я хочуизвлечь как-нибудь и использовать в качестве метки на моих Pandas DataFrames - например Apr 2009.txt
.Это компенсирует отсутствие фактической даты в самом файле.
Есть ли какой-либо способ ввести все файлы локально, по одному за раз, и выложить имена файлов в виде меток, которые разбивают каждую частьобщая датафрейм по дате?
Мой псевдокод:
file = 'PATH\\FileName.txt'
openfile = open(file,'r')
new_line = []
def separateState(l):
for line in l:
if any(x in line for x in ['New York']):
new_line.append(line.split())
Тогда
def joinWords(n):
for listy in n:
operation on each list (listy)
df = pd.DataFrame(appended_data)
df.to_csv('FileName.csv')
Где каждый файл является .txt, когда взяты во вложенных списках (проанализировал эти функции выше по городам).
Ввод выглядит примерно так:
[['CityName1', 'number1'.....'number2'....],.......many other lists of similar types]
Вывод, который я хочу получить:
Date | City | UNIT1 | UNIT2 |.....
FileName (Apr 2009) | CityName1 | number01 | number11 |....
<blank til next file name> | CityName2 | number02 | number12 |....
.
.
.
.
В основном я хочуразделить каждый df по FileName в начале каждого приема.