У меня есть набор предложений, из которых мне нужно извлечь дату переменных форматов. После этого мне нужно очистить данные, например, если присутствует только год, мне нужно добавить 1 в качестве даты и 1 в качестве месяца. Для этого я извлек даты, но для очистки ряда дат мне нужно преобразовать его в дату и время. Я получаю ошибку при этом.
import pandas as pd
date_sent = ["This is year 2019","on 9/95","on 7/27/2019 sjd sdkn","7/24/2019 dhd dskdh"]
df = pd.DataFrame(date_sent, columns=['text'])
df['dates'] = df['text'].str.findall(r'(?:\d{1,2})?/?(?:\d{2})?/?\d{2,4}')
#print(dates.head())
#df['dates'].str.replace(r'(*/*/\d\d)', lambda x: x.groups()[0][0]+1900)
#TRIED THIS TO ADD 1900 to a year if it is only yy but it snot working as well
df['dates']=pd.to_datetime(df['dates'].to_string())
#print(df['dates'])