Мой файл выглядит так:
>2011_07_item_1
CCAATACGGGCGCGCAGGCTTTCTATCGCGCGGCCGGCTTCGTCGAGGAC
GGGCGGCGCAAGGATTACTACCGCAGCGGCCAGGGGCGCGAGGACGCGCT
GCTGATGAGCCGCGCGCTGCCATGAGGGAGACACCGATGCCGATCGTCGC
AACCGAGTCGTGGACGCTGGAACTGCCCGAGGAGTGGTCGGCGCAGGAGG
ACGAGGACGTCGTGGTGATCGAGGACGAGGACGGCGTGAGCTGTCTCGAG
ATCTCGGCGCTGGTGCTGGAGAGCGGCGCCGTGGGCGACGAGGATCTGGC
CGAGTTCAGCCGCGATCTTCTCG
>2011_07_item_2
ATATAAACCTTATTCATCGTTTTCAGCCTAATTTTCCATTTAACAGGGAT
GATTTTCGTCAAAATGCTGAGGCTTTACCAAGATTTTCTACCTTGCACCT
TCAGAAAAAAATCATGGCATTTATAGACGAAATTCTCGAGAAACCATCAT
ACGGATGGACGGACGAAAAGGGCAATTTTTACAAACCTTCACCCAAAGAA
CTGATCAAAGAATTTTTCAGTCGCTTGAATGTATTCAAAAACAAAAAGAA
CTGGCTTGCCTTTACTTCATGGGTTTCCATTCTGATCTTATTTCCGTTTT
TCCTTTTGTTTATCTTCAAATACTTT
>2011_07_item_3
...
Я хочу извлечь идентификаторы:
2011_07_item_1
2011_07_item_2
2011_07_item_3
Я пытался использовать sed -n '/>/,/\n/p'
, но это не работает вообще. Если я использую sed -n '/>/,/[A-Z]/p'
, я получаю идентификатор и первую строку после:
>2011_07_item_1
CCAATACGGGCGCGCAGGCTTTCTATCGCGCGGCCGGCTTCGTCGAGGAC
>2011_07_item_2
ATATAAACCTTATTCATCGTTTTCAGCCTAATTTTCCATTTAACAGGGAT
>2011_07_item_3
Есть идеи, почему это происходит и как это исправить?