Я ищу способ идентифицировать FASTA -файлы как минимум с 3 последовательностями.Последовательности обозначены строками, начинающимися с >
.
. Вот пример из 5 файлов:
file1
>sp1
ATTTT
>sp3
ATTGG
>sp3
ATTGAGGAGA
>sp4
AGGGGAGGACC
>sp5
AGGGGGG
>sp5
AGGGGGG
file2
>sp1
ATTTT
file3
>sp1
ATTTT
>sp3
ATTGG
>sp3
ATTGAGGAGA
>sp4
AGGGGAGGACC
>sp5
AGGGGGG
file4
>sp1
ATTTT
>sp3
ATTGG
file5
>sp1
ATTTT
>sp3
ATTGG
>sp3
ATTGAGGAGA
>sp4
AGGGGAGGACC
>sp5
AGGGGGG
Я хочу вывод:
file1
file3
file5
, так как это файлыпо крайней мере, с тремя последовательностями.Могу ли я сделать это с ls
?