Я пытаюсь почистить в Reddit посты субреддитов, где много вопросов в форме:
s1 = "I [22M] and my partner (21F) are foo and bar"
s2 = "My (22m) and my partner (21m) are bar and foo"
Я хочу сделатьфункция, которая может анализировать каждую строку и затем возвращать пары возраста и пола.Итак:
def parse(s1):
....
return [(22, "male"), (21, "female")]
По сути, каждый тег возраста / пола представляет собой двузначное число, за которым следует либо f, F, m, M
.