Я хочу извлечь время в формате чч: мм и ч: мм из моего фрейма данных raceresult2014, который я читаю из файла PDF.
Team
1 Zeit/temps
2 1. Perraudin Sports II
3 8:18.21
4 Z1-S1
5 1.
6 (505)
7 2. GebSpez Abt 1 Det 1/7
8 8:34.22
9 Z1-MH1
10 1.
11 (513)
12 1.Les filles de Zinal
13 18:21.14
14 Z1-F
15 1. Courvoisier Nathalie
16 18:08.38
17 Z1-S2
Ожидаемый вывод
Team Time
1 Zeit/temps
2 1. Perraudin Sports II 8:18
3 8:18.21
4 Z1-S1
5 1.
6 (505)
7 2. GebSpez Abt 1 Det 1/7 8:34
8 8:34.22
9 Z1-MH1
10 1.
11 (513)
12 1.Les filles de Zinal 18:21
13 18:21.14
14 Z1-F
15 1. Courvoisier Nathalie 18:08
16 18:08.38
17 Z1-S2
, пока этот код работает:
raceresult2014['Time']=raceresult2014['Team'].str.extract('(\d\d:\d\d)',expand=True)
, но он может извлечь только чч: мм формат и оставленный ч: мм невыдержанный.Я попытался добавить еще одну строку
onedigit=raceresult2014['Time']=raceresult2014['Team'].str.extract('(\d:\d\d)',expand=True)
raceresult2014['Time'].append(onedigit)
, но теперь он возвращается к извлечению только формата h: mm и оставлению hh: mm позади.Я знаю, что что-то не так (может быть, о копировании серии raceresult2014 ['Time']?), Но не могу понять, что именно.Был бы очень признателен за помощь.Спасибо!
Я посмотрел везде.может быть что-то вроде маска для одной цифры и две цифры для Python?