Я работаю с двумя файлами, которые называются Список файлов и Таблица подсчетов .Файл списка имеет больше последовательностей (представленных в виде порядковых номеров), чем таблица подсчета.
Я хочу удалить последовательности в файле списка, которых нет в таблице счетчиков.
Например, файл списка, разделенного табуляцией, выглядит следующим образом:
label numOtus Otu1 Otu2 Otu3 Otu4...
0.03 7647 1RDD4_02256_06492,1RDD4_02746_03372,1RDD4_04647_02715 VVP2U_04463_01357,VVP2U_01757_00241,VVP2U_02366_00662 1RDD4_03033_05153,VVP2U_04490_00688,VVP2U_00190_03758 VVP2U_00267_01898,1RDD4_01445_01883,1RDD4_01329_01451 VVP2U_01539_00744,VVP2U_00502_01639,VVP2U_00678_06956 VVP2U_01776_00793,VVP2U_01065_01146,VVP2U_04183_07213 VVP2U_01612_01003,1RDD4_04489_02389 VVP2U_02920_03779,VVP2U_02822_07567
Таблица счета, разделенного табуляцией, выглядит следующим образом:
Representative_Sequence total o132 o137 o139 o143 o145 o146 o154 o155 o156 o212 o213 o216 o219 o220
VVP2U_04986_04053 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0
1RDD4_00428_02444 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0
1RDD4_01405_01516 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0
1RDD4_00607_01976 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0