Поиск файла для символов, исключая набор символов - PullRequest
0 голосов
/ 20 октября 2011

У меня есть текстовый файл с 1,3 млн строк и 258 столбцов, разделенных точками с запятой (;).Как найти символы в файле, исключая буквы алфавита (как в верхнем, так и в нижнем регистре), точку с запятой (;), кавычку (') и двойную кавычку (")? В идеале результаты должны быть вдублированный список.

Ответы [ 2 ]

2 голосов
/ 20 октября 2011

Использовать следующий конвейер

# Remove the characters you want to exclude
tr -d 'A-Za-z;"'\' <file |
# One character on each line
sed 's/\(.\)/\1\
/g' | 
# Remove duplicates
sort -u

Пример

echo '2343abc34;ABC;;@$%"' | 
tr -d 'A-Za-z;"'\' |
sed 's/\(.\)/\1\
/g' | 
sort -u

$
%
2
3
4
@
0 голосов
/ 16 января 2013

вы можете использовать команду grep -v и передать ее для сортировки, а затем в uniq.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...