Обработка исключений и ошибок при разборе даты в Python - PullRequest
1 голос
/ 30 октября 2019

Я работаю с большими базами данных, у которых есть некоторые даты. В настоящее время даты являются строками в этом формате dd/mm/YYYY, поэтому я использую pd.to_datetime(). Это работает почти для каждой таблицы, но у меня есть несколько там не работает, потому что некоторые даты неверны. Например, вместо «1999» это «0199». Из-за этого вывод был "out of bounds nanosecond timestamp"

Поскольку ошибки не следуют шаблону, и я не хочу исключать строки вручную, что я должен сделать, чтобы преобразовать строки, которые являются правильными, и игнорироватьте, которые вызывают ошибки?

1 Ответ

1 голос
/ 30 октября 2019

Вы можете заставить панд игнорировать значения, которые не могут выяснить, и просто установить их на NaT. ссылка

пример:

sanitized_dates = pd.to_datetime(dates, errors='coerce')

Если вы хотите более конкретную обработку, вы можете написать свою собственную функцию и использовать Series.apply() для обработки любых конкретных исправлений.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...