извлечь одно- и двухзначные панды часового времени - PullRequest
0 голосов
/ 26 апреля 2018

Я хочу извлечь время в формате чч: мм и ч: мм из моего фрейма данных raceresult2014, который я читаю из файла PDF.

Team
1   Zeit/temps
2   1. Perraudin Sports II
3   8:18.21
4   Z1-S1
5   1.
6   (505)
7   2. GebSpez Abt 1 Det 1/7
8   8:34.22
9   Z1-MH1
10  1.
11  (513)
12  1.Les filles de Zinal
13  18:21.14
14  Z1-F
15  1. Courvoisier Nathalie
16  18:08.38
17  Z1-S2

Ожидаемый вывод

Team                                Time
1   Zeit/temps
2   1. Perraudin Sports II          8:18
3   8:18.21
4   Z1-S1
5   1.
6   (505)
7   2. GebSpez Abt 1 Det 1/7        8:34    
8   8:34.22
9   Z1-MH1
10  1.
11  (513)
12  1.Les filles de Zinal           18:21
13  18:21.14
14  Z1-F
15  1. Courvoisier Nathalie         18:08
16  18:08.38
17  Z1-S2

, пока этот код работает:

raceresult2014['Time']=raceresult2014['Team'].str.extract('(\d\d:\d\d)',expand=True)

, но он может извлечь только чч: мм формат и оставленный ч: мм невыдержанный.Я попытался добавить еще одну строку

onedigit=raceresult2014['Time']=raceresult2014['Team'].str.extract('(\d:\d\d)',expand=True)
raceresult2014['Time'].append(onedigit)

, но теперь он возвращается к извлечению только формата h: mm и оставлению hh: mm позади.Я знаю, что что-то не так (может быть, о копировании серии raceresult2014 ['Time']?), Но не могу понять, что именно.Был бы очень признателен за помощь.Спасибо!

Я посмотрел везде.может быть что-то вроде маска для одной цифры и две цифры для Python?

1 Ответ

0 голосов
/ 26 июля 2018

Быстрое исправление: Можете ли вы попробовать '\d{1,2}:\d{2}' в качестве выражения регулярного выражения?

{n, m} - это квантификатор, который определяет нижнюю границу и верхнюю границу присутствия определенных символов.Первая \d{1,2} задает одну или две цифры, а вторая \d{2} задает две цифры.

Лично я настоятельно рекомендую использовать https://regexr.com/ для проверки выражений регулярных выражений.Ссылки слева также очень полезны.Вы можете получить больше информации о квантификаторах, нажав «Квантификаторы и перемены» в левой строке меню.

Дайте мне знать, если что-то не понятно.

...