Есть ли где-нибудь компиляция всех видов пробелов: пробелы ascii и не ascii? - PullRequest
0 голосов
/ 06 декабря 2018

Я работаю с документами из разных источников (а также с разными языками), и у меня много проблем с разными определениями пробелов.

Например, '\ xa0' не относится к этому спискуwilipedia Пробелы

Я хочу заменить все из них на ''.Например,

text = re.sub(r'\xa0', ' ', text)

1 Ответ

0 голосов
/ 06 декабря 2018

U + 00A0 находится на той странице Википедии, на которую вы ссылались, в списке Unicode.

Я бы сказал, что Unicode.org имеет полный список: http://unicode.org/cldr/utility/list-unicodeset.jsp?a=%5Cp%7Bwhitespace%7D

...