У меня есть строка:
bdv. mot. g. vns. kilm.
И зная список строк, таких как
important_strings_lst=['bdv.', 'dktv.', 'mot. g.', 'vyr. g.']
Я хочу получить regex
выбор как:
bdv. mot. g.
Я присоединился к списку и попробовал: идея отсюда
regex = re.compile(r'\b(?!bdv.|dktv.|mot. g.|vyr. g.)\w+', re.UNICODE)
regex.sub("", 'bdv. mot. g. vns. kilm.')
Получил
'bdv. mot. . . .'
Смена мест в регулярном выражении с помощью \s
также не сработала.Как это сделать?
Я мог бы использовать что-то вроде [x for x in important_strings_lst if x in my_string]
, но мне нужна хорошая производительность, так как она будет использоваться с миллионами строк информационного кадра панд с str.replace