У меня есть файл FASTA с большим количеством записей.Хотя все последовательности ДНК различны, некоторые из названий FASTA идентичны.Если существует несколько копий имени, я хотел бы добавить число, чтобы они стали уникальными именами.Например:
>NAME
ATTTTTGGGGGGTGTGTG
>NAME
ATTTTTTTTCGCGCGC
>NAME
AAACCCTTTGTG
станет:
>NAME_1
ATTTTTGGGGGGTGTGTG
>NAME_2
ATTTTTTTTCGCGCGC
>NAME_3
AAACCCTTTGTG
спасибо.
обновление.Так как я все равно планировал использовать это в R, я импортировал последовательность фаста в R и получил ее в виде фрейма данных, df.Затем я могу затем переименовать по желанию, используя следующую строку:
library(plyr)
ddply(df, Name_Column, transform, Column = paste(Name_Column,seq_along(Name_Column), sep=""))
код, вдохновленный этим post