Панды - игнорирование форматированных типов данных при чтении CSVS - PullRequest
0 голосов
/ 26 октября 2018

У меня есть очень простая функция, предназначенная для анализа и переформатирования файла CSV:

def parseFile(path, cols=[]):
    """
    Parse futures file given in path and re-index, only keep cols provided
    in cols.
    -------------------
    Usage:
        data = parseFileCSI('C:\\data\\66\\ad_9609', ['Open', 'Volume'])
    """

    filename = path.split('\\')[-1].split('.')[0]
    df = pd.read_csv(path, engine='c')
    df['ID'] = filename

    #align column names with TRTH
    df.rename(columns={'Fut Expiration Date':'ExpirationDate'}, inplace=True)

    df.set_index(['ID', 'ExpirationDate'], inplace=True)

    #keep specified columns
    if cols != []:
        df = df[cols]

    return df

Однако в файлах csv даты истечения срока действия переформатируются в то, что я не желаю, что может бытьсм. ниже:

date

У меня есть тысячи этих CSV-файлов, которые я систематически читаю, поэтому нереально пройти и изменить их все.Как я могу разобрать эти строки даты, например '01-Apr-96', и преобразовать их в действительные даты?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...