У меня есть файл CSV со списком текстов (столбец со строками), и я хочу извлечь возраст пациентов из каждой строки, я не могу сделать с "is di git" Потому что есть также некоторые другие цифры в текстах. как я могу сделать такую вещь? Спасибо
ДОПОЛНИТЕЛЬНО: я тоже хочу выделить пол - Пациента иногда называют мужчиной / женщиной, иногда мужчиной / женщиной, а иногда джентльменом / леди.
Есть ли способ напишите findall, например, если тексту 17 лет, напишите мне число, если за ним следует -year-old
re.findall("[\d].", '-year-old')
Пример строки из текста:
This 23-year-old white female presents with...
...pleasant gentleman who is 42 years old...
...The patient is a 10-1/2-year-old born with...
...A 79-year-old Filipino woman...
Patient, 37,...
Как я могу получить список возраста / пола
т.е.:
Age:
['23','42','79','37'...]
Gender:
['female','male','male','female','male'...]