Я хотел бы посчитать все символы (ACGT) для каждого объекта (здесь GeneID:1
, gi|479
, nf|NZ_AC14
), чтобы я знал длину каждого из этих объектов (не нужно подсчитывать число A, число C ..)
>GeneID:1
ATGCGTTTGCGTTTGCAAATCGACTAGCTTTTGGCCCAAAGCGTGCTGCAAAAGTATGGA
AGTAAAGCTACCGTACGTAGCTAAGCCTACCGATCGATCGATCGATCGACGCCCCCCCCC
>gi|479
ATGGATTGGATGGAATCACAATTCAAGACATGTACGCATGGCTGCGACTGGAAG
>nf|NZ_AC14
ATGGCTAGATATGTCGTATGTTGGATGTTCACCATCAACAATCCCG
У меня есть несколько таких файлов, и я хотел бы использовать команду bash, чтобы все было автоматизировано, но я даже не знаю, с чего начать (в основном, как я буду считать только после начала строки с >
)
Желаемый результат будет:
>GeneID:1 121
>gi|479 54
>nf|NZ_AC14 47
, но если у меня есть только номер, это тоже нормально.
Спасибо