Я хотел бы создать DataFrame для анализа имени некоторых файлов определенного формата.
формат имени файла: event_A_(number)_(start datetime)_(end datetime)_(code)_(category).txt
формат даты и времени: YYYY-MM-DD_HH-MM_SS
пример файла имени: event_A_12_2019-01-22_01-35_20_2019-01-22_19-15_13_b123_aa.txt
Я пытался использовать split, затем простое регулярное выражение и затем слияние строк, но это должен быть простой способ сделать это. Любые предложения о том, как выполнить sh это?
Вот как мне удается это сделать, но я считаю, что должен быть более простой способ:
lst_split = file.split('_')
#number = re.findall(r"_A_(..)",file)
number = lst_split[2]
start_date = lst_split[3]
tmp = lst_split[4] + ":" + lst_split[5]
start_time = tmp.replace('-',':')
end_date = lst_split[6]
tmp = lst_split[7] + ":" + lst_split[8]
end_time = tmp.replace('-',':')
code = lst_split[9]
tmp = (lst_split[10]).split('.')
category = tmp[0]
print(number,start_date,start_time,end_date,end_time,code,category)