В настоящее время у меня есть несколько текстов, которые иногда содержат символ «недопустимый символ», например, \ uf0b7 или \ uf077. У меня нет способа узнать, какой из недопустимых кодов символов может содержать конкретный текст, и я подумал, есть ли способ убедиться, что строка очищена от всех типов «недопустимых символов», поскольку процесс позже (который зависит от стороннего пакета) не может получить строку, которая его содержит.
Я попытался найти решение, но все, что я получаю, это ответы относительно обычных символов, которые люди хотят удалить (например, '^% $ & *'), которые они классифицировали как недопустимые символы, однако я хочу удалить / заменить действительный символ «недопустимый символ» во всех его формах