У меня есть столбец, состоящий из строки, которая содержит дату и время.дата имеет формат: мм / дд / гггг, м / д / гггг, м / дд / гггг и мм / д / гггг, я использовал регулярное выражение, которое помогает мне извлечь мм / дд / гггг и м / д / гггг.Я не могу извлечь m / dd / yyyy и mm / d / yyyy
import pandas as pd
import re
df = pd.read_csv('path of csv file')
corpus = []
for i in range(0,df.shape[0]):
x = df.iloc[i]['OrderTime']
if re.search(r'\d{2}/\d{2}/\d{4}',x): ### for mm/dd/yyyy
y= re.findall(r'\d{2}/\d{2}/\d{4}',x)
corpus.append(y)
elif re.search(r'\d{1}/\d{1}/\d{4}',x): ### for m/d/yyyy
y= re.findall(r'\d{1}/\d{1}/\d{4}',x)
corpus.append(y)
elif re.search(r'\d{1}/\d{2}\d{4}',x): ### for m/dd/yyyy
y= re.findall(r'\d{1}/\d{2}/\d{4}',x)
corpus.append(y)
elif re.search(r'\d{2}/\d{1}\d{4}',x): ### for mm/d/yyyy
y= re.findall(r'\d{2}/\d{1}/\d{4}',x)
corpus.append(y)
else: ### empty cells or says nan
y=["00/00/0000"]
corpus.append(y)
print(corpus)
, например, - дата 12/1/2017, выходной - 01.02.2017 (проблема с mm / d)/ гггг) для даты типа 1/10/2018 выводится 00/00/0000