У меня есть файл с множеством строк и количеством столбцов, и я хотел бы сохранить строки только с первым вхождением шаблона / строки, но для любой повторяющейся строки / шаблона в этом столбце.
, например
cat exp.txt
POS ID REF ALT QUAL FILTER
182 3_12 G A . PASS
192 3_22 A A . PASS
199 4_22 G A . PASS
201 10_22 A A . PASS
214 10_35 A G . PASS
220 10_41 C T . PASS
etc......
И я хотел бы удалить строки, имеющие одинаковый начальный идентификатор (в столбце идентификатора), вплоть до символа "_" ...
например. (после запуска скрипта)
cat post.exp.txt
POS ID REF ALT QUAL FILTER
182 3_12 G A . PASS
199 4_22 G A . PASS
201 10_22 A A . PASS
Я не уверен, как подходить из-за того факта, что я хочу удалить строки с последующим вхождением любого шаблона (вплоть до символа _) в столбце идентификатора, а не просто определенного шаблона. Это вообще возможно?
Спасибо -
LP