Форматирование даты в ММ / ДД / ГГГ из файла xlsb - PullRequest
0 голосов
/ 28 марта 2019

У меня есть файл .xlsb, который я хочу использовать для анализа панд. Я нашел, как использовать pyxlsb, чтобы открыть файл и создать другой набор данных. Однако теперь проблема заключается в том, что форматы времени изменились на другой числовой формат (например, 41256).

Код, который я использую сейчас:

dataset = []

with open_xlsb(file) as wb: #opening an xlsb file workbook
    with wb.get_sheet(1) as sheet1:
        for row in sheet1.rows():
            dataset.append([item.v for item in row])

dataset= pd.DataFrame(dataset[1:], columns=dataset[0])

Я уже пробовал конвертировать дату следующим образом:

convert_date(dataset)

Я также попробовал функцию to_datetime, но не уверен, правильно ли я ее использовал. Для справки, в наборе данных, который я использую, есть даты в нескольких столбцах и строках, поэтому я ищу способ перевести все из них в правильный формат, игнорируя при этом любые ошибки.

РЕДАКТИРОВАТЬ: Таким образом, у меня нет одного столбца с «Дата», скорее у меня есть несколько столбцов, таких как StartDate, EndDate, Last Updates и несколько других. В результате я хочу увидеть, что если я перейду к столбцу, например, dataset.columns ['StartDate'], я хочу получить значение даты, например 15/03/2019, а не 42156.

Любая помощь будет высоко ценится!

1 Ответ

0 голосов
/ 28 марта 2019

Предположим, ваш столбец даты - «Дата», команда будет выглядеть примерно так:

dataset['Date'] = pd.to_datetime(dataset['Date'], format='%m/%d/%Y')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...