У меня есть несколько файлов, к которым я хочу применить эту опцию, если она доступна.
Мой коллега разработал Perl-скрипт для получения доли уникальных символов / строк в файле, начинающихся с определенной координаты, он работает так:
$./perlscript.pl --f=<File.gz> --r=<row start> --c=<col start> > outputfile
Это замечательно, поскольку позволяет обрабатывать файлы разных размеров и размеров.
После применения этого сценария к горстке файлов я обнаружил, что многие из этих уникальных символов идут с пробелом после них.
Этот же коллега разработал скрипт, который заменяет нежелательные символы другими, проблема в том, что этот скрипт просто заменяет одну опцию за раз, и если этот нежелательный символ приходит вместе с другими желаемыми символами, он не распознает определенный нежелательный символ , т.е.:
чтобы получить «AB» и «CD» из «AB» и «CD», я должен указать сценарию заменить «AB» для «AB» и «CD» для «CD» по отдельности.
Я просто хочу исключить пробел, начинающийся с определенной координаты в файле, чтобы не связываться с именами строк и строк.
Это не обязательно должно быть исключительно с sed, это также может быть скрипт на perl или функция awk.