У меня есть очень простая функция, предназначенная для анализа и переформатирования файла CSV:
def parseFile(path, cols=[]):
"""
Parse futures file given in path and re-index, only keep cols provided
in cols.
-------------------
Usage:
data = parseFileCSI('C:\\data\\66\\ad_9609', ['Open', 'Volume'])
"""
filename = path.split('\\')[-1].split('.')[0]
df = pd.read_csv(path, engine='c')
df['ID'] = filename
#align column names with TRTH
df.rename(columns={'Fut Expiration Date':'ExpirationDate'}, inplace=True)
df.set_index(['ID', 'ExpirationDate'], inplace=True)
#keep specified columns
if cols != []:
df = df[cols]
return df
Однако в файлах csv даты истечения срока действия переформатируются в то, что я не желаю, что может бытьсм. ниже:

У меня есть тысячи этих CSV-файлов, которые я систематически читаю, поэтому нереально пройти и изменить их все.Как я могу разобрать эти строки даты, например '01-Apr-96'
, и преобразовать их в действительные даты?