Как я grep для всех не-ASCII символов? - PullRequest
330 голосов
/ 09 июня 2010

У меня есть несколько очень больших файлов XML, и я пытаюсь найти строки, которые содержат символы не ASCII. Я пробовал следующее:

grep -e "[\x{00FF}-\x{FFFF}]" file.xml

Но это возвращает каждую строку в файле, независимо от того, содержит ли строка символ в указанном диапазоне.

У меня неправильный синтаксис или я что-то не так делаю? Я также попробовал:

egrep "[\x{00FF}-\x{FFFF}]" file.xml 

(с одинарными и двойными кавычками вокруг шаблона).

Ответы [ 11 ]

0 голосов
/ 21 декабря 2016

Было бы интересно узнать, как искать один символ Юникода.Эта команда может помочь.Вам нужно только знать код в UTF8

grep -v $'\u200d'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...