У меня есть данные последовательности транскриптома, но во время записи последовательности возникает проблема. Теперь данные секвенирования выглядят следующим образом: Проблема в последовательности fastq при записи из секвенсора
Обычно данные должны выглядеть следующим образом (формат 4 строки):
@HWI-1KL133:1:1101:3288:2194#0/1 [header- first line]
CTGCCCAAAAACTCCTTCTTCTCCGAGTTCCAGATGAATTTTTTCCAGCTG [sequence- second line]
+ [ "+" sign - third line]
Y^^]cccRbc^cWY^aacedhXJbPHWP_^ca^[^Ia^XacIY_R^^cBBB [quality values - fourth line]
@HWI-1KL133:1:1101:3567:2197#0/1
GCAGGGTTTAGGAAGTTGTTCACATTGGGGCTTGGCAGTTGTTGAGAAGGA
+
_b_eeecdgggggiiegiiiihiiiihiiiiiiiiaghgfhhiidhfhhhe
Но в моем случае это выглядит так:
@HWI-1KL133:1:1101:3288:2194#0/1
CTGCCCAAAAACTCCTTCTTCTCCGAGTTCCAGATGAATTTTTTCCAGCTG
+
Y^^]cccRbc^cWY^aacedhXJbPHWP_^ca^[^Ia^XacIY_R^^cBBB@HWI-1KL133:1:1101:3567:2197#0/1
GCAGGGTTTAGGAAGTTGTTCACATTGGGGCTTGGCAGTTGTTGAGAAGGA
+
_b_eeecdgggggiiegiiiihiiiihiiiiiiiiaghgfhhiidhfhhhe
Здесь вы можете видеть, что для первой последовательности поддерживается формат fastq, но для второй последовательности строка заголовка, то есть начинающаяся с @HWI-1KL133:1:1101:3567:2197#0/1
, была объединена со строкой строка первой последовательности.
Я хочу удалить необычный заголовок из 4-й строки и поместить в следующую строку заголовка (1-я строка следующей или второй последовательности). Прошу вас предоставить возможное решение.