Я извлекаю коды из списка строк, используя текст письма или тему.Выглядит примерно так:
text_list = ['RV: Final model review and algorithm COde 053 and also with CODE52','CODE22/coDe129','CODE178/coDe029']
Пока что я попробовал:
def containsDigit(word):
if re.search("\d", word):
return word
regex = re.compile('[CcOoDdEe]{4,}')
codes = []
codes_found = []
for text in text_list:
codes_found.append(regex.findall(text))
for code in codes_found:
codes.append(containsDigit(code))
Моя проблема в том, что я не могу извлечь цифры рядом с кодом или с помощью'' пробел в нем.
Мой желаемый результат будет:
codes = ['COde 053', 'CODE52','CODE22','coDe129','CODE178','coDe029']