У меня есть файл:
scaffold_0 11498
scaffold_0 11501
scaffold_0 11728 "RHOH"
scaffold_0 12144 "RHOH"
scaffold_0 20708 "RHOH"
scaffold_0 23579 "RHOH"
scaffold_0 130818
scaffold_0 200485 "NSUN7"
scaffold_0 209928 "NSUN7"
scaffold_0 212965 "NSUN7"
scaffold_0 214055 "APBB2"
scaffold_0 223404
scaffold_0 223686 "APBB2"
scaffold_0 227687 "APBB2"
scaffold_0 306105 "APBB2"
scaffold_0 307000 "APBB2"
scaffold_0 391742
scaffold_0 399332 "UCHL1"
scaffold_0 406726 "UCHL1"
scaffold_0 482215
scaffold_0 484921
scaffold_0 538855 "LIMCH1"
scaffold_0 539051 "LIMCH1"
scaffold_0 539819
scaffold_0 543347 "LIMCH1"
scaffold_0 568182 "LIMCH1"
scaffold_0 570321
scaffold_0 570325
scaffold_0 577502 "LIMCH1"
scaffold_0 578933 "LIMCH1"
scaffold_0 621330 "PHOX2B"
scaffold_0 623303 "PHOX2B"
scaffold_0 640271
scaffold_0 667510 "gene3"
scaffold_0 679096
scaffold_0 698659 "TMEM33"
scaffold_0 700427 "TMEM33"
, и я хочу напечатать строки, для которых элементы в 3-м столбце повторяются 3 или более раз.Чтобы удалить эти строки:
scaffold_0 399332 "UCHL1"
scaffold_0 406726 "UCHL1"
scaffold_0 621330 "PHOX2B"
scaffold_0 623303 "PHOX2B"
scaffold_0 667510 "gene3"
scaffold_0 698659 "TMEM33"
scaffold_0 700427 "TMEM33"
Я был бы рад сохранить порядок файлов и строки, для которых 3-й столбец пуст.Я попробовал:
sort -k3 file.txt | awk 'a[$3]++{ if(a[$3]>=2){ print b }; print $0}; {b=$0}'