Я пытаюсь удалить шаблон, используя следующий код
x = "mr<u+092d><u+093e><u+0935><u+0941><u+0915>"
pattern = '[<u+0-9de>]'
re.sub(pattern,'', x)
Вывод
mr
Этот вывод действительно верен для данной строки образца, но когда я запускаю этот код для корпус, он удаляет все вхождения 'de', а также цифры et c. Я хочу, чтобы эти вещи заменялись только при использовании <>.