Я ищу решение R для извлечения нескольких последовательностей из файла FASTA на основе совпадения со списком идентификаторов заголовков в отдельном файле (.csv).
Я новичок в R и пытаюсь найти способ:
Возьмите файл, содержащий строки, которые будут в заголовках fasta
Файл header_ID_strings выглядит следующим образом:
CAP357_2030, CAP357, CAP3571 и т. Д ...
образец моего файла fasta выглядит так:
CAP357_2030
GTAAAATTAACCCCACTCTGTGTCACTCTAAATTGTACAACTGCAAAGGG
CAP357
GTAAAATTAACCCCACTCTGTGTCACTCTAAATTGTACAACTGCAAAGGGT
CAP3571
GTAAAATTAACCCCACTCTGTGTCACTCTAAATTGTACAACTGCAAAGGGT
CAP357_2040_011wpi_v1v3_1_004_00001_000.2
GTAAAATTAACCCCACTCTGTGTCACTCTAAATTGTACAACTGCAAAGGGT
CAP357_2050_013wpi_v1v3_1_047_00002_000.4
GTAAAATTAACCCCACTCTGTGTCACTCTAAATTGTACAACTGCAAAGGGT
Я ожидаю вывода нового файла FASTA, содержащего только последовательности заголовочных идентификаторов (в .csv), и отбрасываю остальные, идентификаторы которых я не предоставил. Спасибо