awk держать на печати только первую строку внутри цикла while, если нет эхо, объяснение теории - PullRequest
0 голосов
/ 02 июля 2019

У меня есть команда awk, которая выводит результаты изменения строки в цикле:

clinvar_db=$1
output_file=$2

if [ -f "$output_file" ]; then
  rm "$output_file"
fi

zcat < "$clinvar_db" | grep -v '^#' | while read line; do

  chr=`echo $line | awk '{print $1}' | tr -d '[:space:]'`
  pos=`echo $line | awk '{print $2}' | tr -d '[:space:]'`


  clnrevstat=`echo $line | sed -e 's/.*CLNREVSTAT=\(.*\);CLNSIG.*/\1/' | cut -d';' -f1`

  ref_all=`echo $line | awk '{print $4}' | tr -d '[:space:]'`
  alt_all=`echo $line | awk '{print $5}' | tr -d '[:space:]'`
  effect=`echo $line | sed -e 's/.*MC=\(.*\);.*/\1/' | cut -d';' -f1 | cut -d'|' -f2`
  ref_length=`printf $ref_all | wc -c | tr -d '[:space:]'`
  alt_length=`printf $alt_all | wc -c | tr -d '[:space:]'`
  if [ "$ref_length" -ne "$alt_length " ] || [ "$effect" == 'frameshift_variant' ] || [ "$effect" == 'nonsense' ] || [ "$effect" == 'splice_acceptor_variant' ] || [ "$effect" == 'splice_donor_variant' ]; then
    var_effect='lof'
  elif [ "$effect" == 'missense_variant' ]; then
    var_effect='miss'
  elif [ "$effect" == 'synonymous_variant' ]; then
    var_effect='syn'
  elif [ "$effect" == 'intron_variant' ] || [ "$effect" == '3_prime_UTR_variant' ]; then
    var_effect='intron'
  else
    var_effect='NA'
  fi

  if [ "$clnrevstat" == 'criteria_provided,_conflicting_interpretations' ] || [ "$clnrevstat" == 'criteria_provided,_single_submitter' ]; then
    clnstar=1
  elif [ "$clnrevstat" == 'no_assertion_criteria_provided' ] || [ "$clnrevstat" == 'no_assertion_provided' ] || [ "$clnrevstat" == 'no_interpretation_for_the_single_variant' ]; then
    clnstar=0
  elif [ "$clnrevstat" == 'criteria_provided,_multiple_submitters,_no_conflicts' ]; then
    clnstar=2
  elif [ "$clnrevstat" == 'reviewed_by_expert_panel' ]; then
    clnstar=3
  elif [ "$clnrevstat" == 'practice_guideline' ]; then
    clnstar=2
  else
    clnstar=NA
  fi

  awk -v OFS='\t' -v chr="$chr" -v pos="$pos" -v ref="$ref_all" -v alt="$alt_all" -v var_effect="$var_effect" -v clnstar="$clnstar" '{print chr,pos,".",ref,alt,".",".",".",var_effect,clnstar}'

done

это выводит одну и ту же (первую) строку снова и снова:

1   949422  .   G   A   .   .   .   miss    1
1   949422  .   G   A   .   .   .   miss    1
1   949422  .   G   A   .   .   .   miss    1
1   949422  .   G   A   .   .   .   miss    1
1   949422  .   G   A   .   .   .   miss    1
1   949422  .   G   A   .   .   .   miss    1
1   949422  .   G   A   .   .   .   miss    1
# ...

если я добавлю echo до последнего awk

# ... rest of my script ...
  echo  | awk -v OFS='\t' -v chr="$chr" -v pos="$pos" -v ref="$ref_all" -v alt="$alt_all" -v var_effect="$var_effect" -v clnstar="$clnstar" '{print chr,pos,".",ref,alt,".",".",".",var_effect,clnstar}'
# ... rest of my script ...

ВЫХОД:

1   949422  .   G   A   .   .   .   miss    1
1   949502  .   C   T   .   .   .   miss    1
1   949523  .   C   T   .   .   .   lof 0
1   949559  .   C   T   .   .   .   miss    1
1   949597  .   C   T   .   .   .   syn 1
1   949608  .   G   A   .   .   .   miss    1
1   949635  .   G   A   .   .   .   miss    1
1   949656  .   G   A   .   .   .   miss    1
1   949696  .   C   CG  .   .   .   lof 0
# ...

, это решит проблему, но я хотел бы узнать от вас, опытные ребята, почему!Это не должно было бы делать это один раз за итерацию?Я искал здесь и в Интернете, но я не мог понять это сам ...

Заранее большое спасибо за любую помощь!

1 Ответ

0 голосов
/ 02 июля 2019

Когда вы вызываете awk без эха, он читает из того же канала, что и цикл while read. Цикл while читает первую строку, а awk читает все остальные.

...