выражение sed & regex - PullRequest
0 голосов
/ 01 июня 2018

Я пытаюсь добавить строку 'chr' в строки, которых там нет.Эта операция необходима только в строках, которые не имеют ##.Сначала я использую команды grep + sed, как показано ниже, но я хочу запустить команду, перезаписывающую исходный файл.

grep -v "^#" 5b110660bf55f80059c0ef52.vcf | grep -v 'chr' | sed 's/^/chr/g'

Итак, чтобы запустить команду в файле, я пишу это:

sed -i -E '/^#.*$|^chr.*$/ s/^/chr/' 5b110660bf55f80059c0ef52.vcf

Это содержимое файла vcf.

##FORMAT=<ID=DP4,Number=4,Type=Integer,Description="#ref plus strand,#ref minus strand, #alt plus strand, #alt minus strand">
#CHROM  POS ID  REF ALT QUAL    FILTER  INFO    FORMAT  24430-0009S21_GM17-12140
1   955597  95692   G   T   1382    PASS    VARTYPE=1;BGN=0.00134309;ARL=150;DER=53;DEA=55;QR=40;QA=39;PBP=1091;PBM=300;TYPE=SNP;DBXREF=dbSNP:rs115173026,g1000:0.2825,esp5400:0.2755,ExAC:0.2290,clinvar:rs115173026,CLNSIG:2,CLNREVSTAT:mult,CLNSIGLAB:Benign;SGVEP=AGRN|+|NM_198576|1|c.45G>T|p.:(p.Pro15Pro)|synonymous GT:DP:AD:DP4    0/1:125:64,61:50,14,48,13
chr1    957898  82729935    G   T   1214    off_target  VARTYPE=1;BGN=0.00113362;ARL=149;DER=50;DEA=55;QR=38;QA=40;PBP=245;PBM=978;NVF=0.53;TYPE=SNP;DBXREF=dbSNP:rs2799064,g1000:0.3285;SGVEP=AGRN|+|NM_198576|2|c.463+56G>T|.|intronic    GT:DP:AD:DP4    0/1:98:47,51:9,38,10,41

Ответы [ 3 ]

0 голосов
/ 01 июня 2018

Ваш вопрос не ясен, и вы не предоставили ожидаемый результат, поэтому мы не можем протестировать потенциальное решение, но если все, что вам нужно, это добавить chr в начало строк, где его еще нет и какиене начинайте с #, тогда это просто:

awk '!/^(#|chr)/{$0="chr" $0} 1' file

Чтобы перезаписать исходный файл с помощью GNU awk, будет:

awk -i inplace '!/^(#|chr)/{$0="chr" $0} 1' file

и с любым awk:

awk '!/^(#|chr)/{$0="chr" $0} 1' file > tmp && mv tmp file
0 голосов
/ 01 июня 2018

Если я понимаю, каков ваш ожидаемый результат, попробуйте:

sed -ri '/^(#|chr)/! s/^/chr/' file
0 голосов
/ 01 июня 2018

Это можно сделать с помощью одного sed вызова.Сам скрипт выглядит примерно так:

Если у вас есть ввод в формате

$ echo -e '#\n#\n123chr456\n789chr123\nabc'
#
#
123chr456
789chr123
abc

, то для добавления chr к некомментированным строкам chrless делается как

$ echo -e '#\n#\n123chr456\n789chr123\nabc' | sed '/^#/ {p
d
}
/chr/ {p
d
}
s/^/chr/'

, который печатает

#
#
123chr456
789chr123
chrabc

(обратите внимание на многострочный sed скрипт.)

Теперь вам нужно только запустить этот скрипт на месте файла (-i в современномsed версии.)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...