У меня есть список последовательностей фаста следующим образом:
>Product_1_001:299:H377WBGXB:1:11101
TGATCATCTCACCTACTAATAGGACGATGACCCAGTGACGATGA
>Product_2_001:299:H377WBGXB:2:11101
CATCGATGATCATTGATAAGGGGCCCATACCCATCAAAACCGTT
Исходная последовательность выполнения намного длиннее, чем подмножество, размещенное здесь. Я хотел извлечь 10 символов после шаблона "TCAT" в отдельный файл и сделал это
grep -oP "(?<=TCAT).{10}"
Я получаю нужный результат как:
CTCACCTACT
TGATAAGGGG
Я хотел бы, чтобы их соответствующие идентификаторы фаст-фудов были в виде одного столбца, а извлеченный шаблон - во втором столбце, например:
>Product_1_001:299:H377WBGXB:1:11101 CTCACCTACT
>Product_2_001:299:H377WBGXB:2:11101 TGATAAGGGG