Я выполнил реконструкцию предковой последовательности, чтобы определить нуклеотидную последовательность для каждого узла данного c дерева филогенетики. Выходной файл представляет собой таблицу с наиболее вероятными нуклеотидами в каждой позиции для каждого узла (см. Ниже):
#output file:
node_name, position, nucleotide
node1, 1, A
node1, 2, T
node1, 3, G
....
node2, 1, A
node2, 2, T
node2, 3, G
...
Я хотел бы преобразовать этот выходной файл в файл fasta, например:
>node1
ATG....
>node2
ATG....
.....
Как мне выполнить эту задачу с помощью функции python, R или сценария оболочки (с командами awk и sed)?
С уважением,
Габриэль