Необычная ошибка записи в файле fastq: заголовок перемещается на 4-ю строку, т. Е. Строка значения показателя качества - PullRequest
0 голосов
/ 11 февраля 2020

У меня есть данные последовательности транскриптома, но во время записи последовательности возникает проблема. Теперь данные секвенирования выглядят следующим образом: Проблема в последовательности fastq при записи из секвенсора

Обычно данные должны выглядеть следующим образом (формат 4 строки):

@HWI-1KL133:1:1101:3288:2194#0/1 [header- first line]
CTGCCCAAAAACTCCTTCTTCTCCGAGTTCCAGATGAATTTTTTCCAGCTG [sequence- second line]
+ [ "+" sign - third line]
Y^^]cccRbc^cWY^aacedhXJbPHWP_^ca^[^Ia^XacIY_R^^cBBB [quality values - fourth line]

@HWI-1KL133:1:1101:3567:2197#0/1
GCAGGGTTTAGGAAGTTGTTCACATTGGGGCTTGGCAGTTGTTGAGAAGGA
+
_b_eeecdgggggiiegiiiihiiiihiiiiiiiiaghgfhhiidhfhhhe

Но в моем случае это выглядит так:

@HWI-1KL133:1:1101:3288:2194#0/1
CTGCCCAAAAACTCCTTCTTCTCCGAGTTCCAGATGAATTTTTTCCAGCTG
+
Y^^]cccRbc^cWY^aacedhXJbPHWP_^ca^[^Ia^XacIY_R^^cBBB@HWI-1KL133:1:1101:3567:2197#0/1
GCAGGGTTTAGGAAGTTGTTCACATTGGGGCTTGGCAGTTGTTGAGAAGGA
+
_b_eeecdgggggiiegiiiihiiiihiiiiiiiiaghgfhhiidhfhhhe

Здесь вы можете видеть, что для первой последовательности поддерживается формат fastq, но для второй последовательности строка заголовка, то есть начинающаяся с @HWI-1KL133:1:1101:3567:2197#0/1, была объединена со строкой строка первой последовательности.

Я хочу удалить необычный заголовок из 4-й строки и поместить в следующую строку заголовка (1-я строка следующей или второй последовательности). Прошу вас предоставить возможное решение.

...