У меня есть pandas DataFrame
формы:
id amount birth
0 4 78.0 1980-02-02 00:00:00
1 5 24.0 1989-03-03 00:00:00
2 6 49.5 2014-01-01 00:00:00
3 7 34.0 2014-01-01 00:00:00
4 8 49.5 2014-01-01 00:00:00
Меня интересуют только год, месяц и день в столбце birth
в dataframe
. Я попытался использовать Python datetime
из pandas
, но это привело к ошибке:
OutOfBoundsDatetime: Out of bounds nanosecond timestamp: 1054-02-07 00:00:00
Столбец birth
имеет тип object
dtype.
Я предполагаю, что будь то дата неверная. Я бы не хотел бы передать параметр errors="coerce"
в метод to_datetime
, потому что каждый элемент важен, а мне нужен только YYYY-MM-DD
.
Я пытался использовать regex
из pandas
:
df["birth"].str.find("(\d{4})-(\d{2})-(\d{2})")
Но это возвращает NANs
. Как я могу решить эту проблему?
Спасибо