Я получил это. Вы используете обратные ссылки,
import re
smallBig = re.compile(r'[a-z]([A-Z])')
...
cleanedString = smallBig.sub(r'\1', dirtyString)
Это удаляет маленькую букву, но сохраняет заглавную букву в случаях, когда «<» и «>» HTML-тегов были удалены, и вы сидите с текстом, как
pSome новый текст абзаца / p
Быстро и грязно, но в моем случае это работает.