У меня есть текстовый файл с множеством неструктурированных данных, из которых я пытаюсь получить имена и даты рождения, используя 1 RegEx. Стена, на которую я натолкнулся, состоит в том, что даты могут заканчиваться в одной строке и продолжаться в другой, и re.DOTALL, похоже, не работает. Формат данных, которые я хочу, всегда:
фамилия, отчество (иногда), имя, f. ДД-ММ-ГГГГ
Это мой RegEx:
re.findall(r'\w+,*\sf\.\s\d\d-\d\d-\d\d\d\d', re.DOTALL):
Это не дает следующие разрывы строк:
Смит, Джон,
ф. 25-12-1990
или только первая часть ниже:
Smith, John, f. 25-12-
1990
Смит, Джон, ф. 25-
12-1990