Question

У меня есть очень простая функция, предназначенная для анализа и переформатирования файла CSV:

def parseFile(path, cols=[]):
    """
    Parse futures file given in path and re-index, only keep cols provided
    in cols.
    -------------------
    Usage:
        data = parseFileCSI('C:\\data\\66\\ad_9609', ['Open', 'Volume'])
    """

    filename = path.split('\\')[-1].split('.')[0]
    df = pd.read_csv(path, engine='c')
    df['ID'] = filename

    #align column names with TRTH
    df.rename(columns={'Fut Expiration Date':'ExpirationDate'}, inplace=True)

    df.set_index(['ID', 'ExpirationDate'], inplace=True)

    #keep specified columns
    if cols != []:
        df = df[cols]

    return df

Однако в файлах csv даты истечения срока действия переформатируются в то, что я не желаю, что может бытьсм. ниже:

У меня есть тысячи этих CSV-файлов, которые я систематически читаю, поэтому нереально пройти и изменить их все.Как я могу разобрать эти строки даты, например '01-Apr-96', и преобразовать их в действительные даты?

Панды - игнорирование форматированных типов данных при чтении CSVS

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Панды - игнорирование форматированных типов данных при чтении CSVS

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 0 ]

Нет похожих вопросов