Пользователи иногда используют странные символы ASCII в программе, и мне было интересно, есть ли способ «нормализовать» это.
Таким образом, в основном, если вход ᴀʙᴄᴅᴇꜰɢ
, выход будет ABCDEFG
. Есть ли где-то словарь, который делает что-то подобное? Если нет, есть ли лучший способ, чем просто сделать что-то вроде str.replace("ᴀ", "A")
для всех разных «шрифтов»?
Это не вопрос конкретного языка - если чего-то такого не существует, думаю, следующим шагом будет создание словаря самостоятельно.