Преобразование текста fancy / artisti c unicode в ASCII - PullRequest
1 голос
/ 08 июля 2020

У меня есть строка Юникода, такая как «???? ????», и я хотел бы преобразовать ее в форму ASCII «thug life».

Я знаю, что могу добиться этого за Python с помощью

import unidecode
print(unidecode.unidecode('???? ????'))
// thug life

Тем не менее, это приведет к усилению и других символов Юникода (таких как китайские / японские символы, смайлики, символы с диакритическими знаками и т. Д. c.), Которые я хочу сохранить.

Есть ли способ определить этот тип символов Unicode "artisti c"?

Еще несколько примеров:

???? ????

???? ????

???? ????

thug life

Спасибо за вашу помощь!

1 Ответ

2 голосов
/ 09 июля 2020
import unicodedata
strings = [
  '???? ????',
  '???? ????',
  '???? ????',
  '???? ????',
  'thug life']
for x in strings:
  print(unicodedata.normalize( 'NFKC', x), x)

Вывод : .\62803325.py

thug life ???? ????
thug life ???? ????
thug life ???? ????
thug life ???? ????
thug life thug life

Ресурсы :

...