У меня есть частота (столбец 1) для мутаций SYNONYMOUS_CODING
и NON_SYNONYMOUS_CODING
(столбец 3) для списка генов во втором столбце.
Мне нужно рассчитать соотношение dN/dS
(NON_SYNONYMOUS_CODING / SYNONYMOUS_CODING
) для каждого гена.
Не все гены могут иметь частоту SYNONYMOUS_CODING
и NON_SYNONYMOUS_CODING
0.00491398 A1BG SYNONYMOUS_CODING
0.923601 A1BG NON_SYNONYMOUS_CODING
0.051361 A1CF NON_SYNONYMOUS_CODING
0.153161 A1CF SYNONYMOUS_CODING
0.0977385 A2M SYNONYMOUS_CODING
1.36114 A2M NON_SYNONYMOUS_CODING
2.19662 A2ML1 SYNONYMOUS_CODING
3.43866 A2ML1 NON_SYNONYMOUS_CODING
Ожидаемый результат - что-то вроде этого:
187.95 A1BG
0.3353 A1CF
13.926 A2M
1.565 A2ML1