Я использую to_datetime
для форматирования данных для DataFrame следующим образом:
import pandas as pd
df = pd.read_csv('C:/Users/79219/Downloads/bd_with_names.csv', sep = ';')
from datetime import datetime, date
df['data_posledney_pokupki']=df['data_posledney_pokupki'].str.split(' ').str.get(0)
df.head()
df['created_date']=df['created_date'].str.split(' ').str.get(0)
df.head()
до того, как я правильно изменю данные типов. Результат1:
user_id created_date summa_pokupok kolichestvo_pokupok data_posledney_pokupki
0 0000186661 2018-05-15 760 1 21.02.2020
1 21_0018542 2017-02-11 1899 1 11.01.2020
2 17_0069595 2017-11-01 14606 13 26.06.2020
3 14_0109526 2017-03-18 18334 4 06.03.2020
после того, как я применил to_datetime
df['data_posledney_pokupki'] = pd.to_datetime(df['data_posledney_pokupki'],format="%Y/%m/%d")
df['created_date'] = pd.to_datetime(df['created_date'])
df.head()
в некоторых строках переключение дней и месяцев, в некоторых из них остается в правильном положении: Результат2:
0 0000186661 2018-05-15 760 1 2020-02-21
1 21_0018542 2017-02-11 1899 1 2020-11-01
2 17_0069595 2017-11-01 14606 13 2020-06-26
3 14_0109526 2017-03-18 18334 4 2020-06-03
Данные в строке [0] по-прежнему верны, но дата в строке [1] теперь неверна. Где ошибка?