Как идентифицировать и удалить мусорные символы? - PullRequest
0 голосов
/ 16 декабря 2018

У меня есть текстовый файл на китайском языке, который содержит много искаженного текста между хорошим китайским текстом (из преобразования PDF в TXT.)Английский текст не поврежден?

Вот сокращенная версия файла

...