измените "+" в файле fastq.ошибка phred_offset qiime - PullRequest
0 голосов
/ 24 мая 2018

У меня проблема с некоторыми чтениями fastq:

@1V3F_10526394 M01994:35:000000000-BM49D:1:1106:17684:21227 1:N:0:1 orig_bc=GGAATCTCTATAGCCT new_bc=GGAATCTCTATAGCCT bc_diffs=0
+
CGTACACTCCTGCGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCGACGCCGCGTGCGGGATGACGGCCTTCGGGTTGTAAACCGCTTTTGATCGGGAGCAAGCCTTCGGGTGAGTGTACCTTTCGAATAAGCACCGGCTAACTACGTGCCAGCAGCCGCGGTAATACGTAGGGTGCAAGCGTTATCCGGAATTATTGGGCGTAAAGGGCTCGTAGGCGGTTCGTCGCGTCCGGTGTGAAAGTCCATCGCTTAACGGTGGATCCGCGCCGGGTACGGGCGGGCTTGAGTGCGGTAGGGGAGACTGGAATTCCCGGTGTAACGGTGGAATGTGTAGATATCGGGAAGAACACCAATGGCGAAGGCAGGTCTCTGGGCCGTTACTGACGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCCTGTAGTCCC
+
CCCCCGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGDGGGDGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGFGGGGDGGCFGGGGGGGGGDGGGFGGGGGGDGGGGGGGGGGGGGCFG@CFGFGCFFGGGFGGFDFGGDGGGEFCGGCFGGGFGGGGGGDGGGGGFGGGGGGGGGGGDGGGGGGGFGDFFGGGGGGGGGGGGGGGGDECGGF7EEGGGGGFGGGGGGGGGGGGGFCGGGGEEGGGEEGGGGGGGF@CEGGGGGGGGGGGGGGGGGGGGFBGDGGGGFDGGGGGCGDGGGGGFGGGGGGGGGFGGGGGGGGGGGGGGGGGGGGEGGGGGGGGFCGGGGGGDGGGFGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGEGGFGGGGGGGGGGGGGGGGGGGGGGCCCCC

Первый «+» - это проблема.Как я могу удалить это?

Обратите внимание, что не все чтения имеют эту проблему, поэтому я не могу удалить каждую вторую строку после символа "@", как я уже пытался ..

1 Ответ

0 голосов
/ 29 июня 2018

Возможно, вы можете попытаться удалить все строки «+», а затем добавить строку «+» каждые 3. Вероятно, будет легче, чем пытаться определить, правильно ли размещен «+».

cat file.fastq | sed '/^+$/d' | awk '{print; if (NR%3==2){print "+"}}' > fixed.fastq
...