Я пытаюсь проанализировать некоторые результаты, предоставленные HMMER, и в файле tblout мне удалось выделить нужные совпадения.
Тем не менее, одно и то же значение повторяется несколько раз, если оно совпадает только с однимprofile.
Например, это одно чтение повторяется 3 раза:
SRR6033660.161030 FAM007172 4e-15 4.2e-15 63.4 63.4
SRR6033660.1458607 FAM019859 2.5e-12 2.7e-12 55.0 54.9
SRR6033660.1458607 FAM015326 4e-14 4.2e-14 58.8 58.7
SRR6033660.1458607 FAM000764 7.5e-25 8.1e-25 94.6 94.5
Это соответствует 3 семействам, тем не менее, я просто хочу выбрать строку с самыми низкими значениями e(3-й и 4-й столбцы)
Как мне написать команду awk, которая выдаст мне этот вывод?
SRR6033660.161030 FAM007172 4e-15 4.2e-15 63.4 63.4
SRR6033660.1458607 FAM000764 7.5e-25 8.1e-25 94.6 94.5
Спасибо!